在 AI coding 上的困境，想做个调研

请不要在回答技术问题时复制粘贴 AI 生成的内容

先说问题，不绕。。。。你们觉得目前你最常用的模型，在开放需求下它的功能、架构设计你能给它定多少年工作经验的程序员（或阿里 P 几水平）。

模型：gpt5.5 中（大部分功能设计，因为便宜），Claude Opus 4.6 我的困境：

如果我的需求过于开放，在 plan 的时候，架构功能设计质量非常不稳定，大多数时候在我擅长领域我认为只能达到 4 年的程序员水准。
如果我给的过于严格的边界和约束，那么会变成 AI 的上限就是我的上限，又太过于突出个人能力或者弱化了 AI 的能力。
如果我给的过于严格的边界和约束并且总是坚持我的想法，那就变成了我在教 AI 做事，这里大量的成本在我和 ai 的沟通，并且需要它完全明白我的意思。

当然，上面的所有前提都是一个生产项目和程序员职业。自己 coding 玩具项目或者非程序员岗位不算

模型

困境

程序员

19 replies 2026-05-09 12:26:47 +08:00

sentinelK

4 days ago

1 、我会干预其架构设计。不是别的，是因为我要为我的 Agent 兜底，他的技术选型我看不懂我就兜不了……
2 、看心情，所以我目前在尝试可能的情况下，让 hermes 接管我的代码仓库和文档，让他帮我去调用 claudeCode/openCode 。我只提需求和把控设计。
3 、同理，hermes 可以大幅度降低人工提供上下文的心智负担。

someonelikeyouah

4 days ago

偏个题，评估这个意义在哪里？你自己知道上限下限能做到哪里就行了，评级是为了给公司指出开发的预算么？

sentinelK

4 days ago

btw：使用大模型，核心矛盾点，就是你需要投入多少精力来进行控制。这和企业管理的底层逻辑相通。

你给员工更大的自由，他就更能发挥上限，代价就是捅娄子的能力也更强。
你越依赖微操，你的员工的能力就越难以发挥，也就越难以突出你的人力优势。这里要 @蒋委员长

lmmlwen

4 days ago

一个小小的程序员如此大放厥词，ai 编码是无上限的，只是你和你们的项目代码过于平庸，它只是选择了一个最为中庸的结果给你。

lmmlwen

4 days ago

阿里 p8 的 py 代码，还得我来修改一轮低级 bug ，这没有任何意义

skuuhui

4 days ago

@sentinelK 我会尝试一下你的方式。但有时候我会总会觉得，流程越复杂，ai 调用层级越多，出错的概率越大 0.99*n

skuuhui

4 days ago

@someonelikeyouah 人类可能是以后公司内唯一需要承担责任的少部分实体。如果一个功能 A 跑了 2 天，上限直接奔溃了，老板可不会追责 AI

skuuhui

4 days ago

@lmmlwen bug 还只是最简单的错误了。如果一开始实现上就存在隐患，如果后期产生问题，影响范围和修复成本都很高

sentinelK

4 days ago

@skuuhui 这个直觉没错的，但是对应的账应该反过来算。
1 、你降低了你自己的心智负担，你就更有时间、精力来给模型兜底。
2 、目前主流的 Agent 思路是 loop + 审核抽卡，所以误差的积累很大程度上可以靠增多多抽卡次数来抹平。也就是靠烧更多的 token 来换你更少的干预。
3 、目前模型的能力更强了，最优解的统计学优势更明显，即便上下文有一系列错误，也会无视或者自行纠错。

someonelikeyouah

4 days ago

@skuuhui #7 可行性分析现在是开发来主导了么？

teaguexiao

4 days ago

我的做法是先让 AI 出两三个方案，我挑一个架构方向再让它深入，这样既保留了它的发挥空间，也避免一开始就跑偏。开放需求不等于无约束，提前给定一些不可碰的边界（比如技术栈、分层规范）能显著稳定输出质量。

foryou2023

4 days ago

需求描述清楚，让 ai 给解决方案，符合自己需求的方案，然后再细化，需求细节讨论的差不多了，然后写文档，再让 ai 干活。

现实跟产品沟通不也是这样的么，沟通清楚需求，然后自己出解决方案，然后实现。

现在只不过变成了指挥 ai 干活而已。

foryou2023

4 days ago

@foryou2023 认知上把 ai 当成一个啥都会干的人，正常沟通，这样操作，个人实践过程中感觉挺好的。

skuuhui

4 days ago

@someonelikeyouah 我期望不是由开发来主导，但目前是开发来担责，谁也不愿意担责。

huoru

4 days ago

你们还 review AI 写的代码吗？

skuuhui

4 days ago

@teaguexiao
@foryou2023
你们的方案是所有能看到的技术贴都提到的并且也最为大家熟知的。但我是无论是严格执行还是局部优化结果都差强人意，至少去年 9 月我就是实践过这一套了。所以我好奇，说这些理论的人是缺乏实践随口一说停留的想象层面，还是自己有一套自己专属的驾驭方式只是没有表达清楚。
另外：其实你定义了约束就是限制了开放性，如果指令遵循的好，他永远设计不出超出你边界外更合理的设计。这本质上来说和你教他怎么做一样。无法就是一个是我告诉他要做什么，一个是我告诉他不能做什么。

Cabana

4 days ago

所以再等等下个世代的基础模型吧，就不会有这么多需要在工程上去处理基础模型的能力边界问题了。目前的话就只能修修补补咯~

paranoiagu

4 days ago

你是产品经理，AI 是原来你的手下小伙伴。

你觉得该怎么用这些小伙伴就怎么样用。AI 比小伙伴更加肯干，知识更加全面，没有怨言………………

xsen

3 days ago

codex $100 + claude $20
claude: 讨论需求、架构、设计，生成提示词
codex：执行