在 AI coding 上的困境,想做个调研 - V2EX
请不要在回答技术问题时复制粘贴 AI 生成的内容
skuuhui

在 AI coding 上的困境,想做个调研

  •  
  •   skuuhui 4 days ago 2334 views

    先说问题,不绕。。。。你们觉得目前你最常用的模型,在开放需求下它的功能、架构设计你能给它定多少年工作经验的程序员(或阿里 P 几水平)。

    模型:gpt5.5 中(大部分功能设计,因为便宜),Claude Opus 4.6 我的困境:

    1. 如果我的需求过于开放,在 plan 的时候,架构功能设计质量非常不稳定,大多数时候在我擅长领域我认为只能达到 4 年的程序员水准。
    2. 如果我给的过于严格的边界和约束,那么会变成 AI 的上限就是我的上限,又太过于突出个人能力或者弱化了 AI 的能力。
    3. 如果我给的过于严格的边界和约束并且总是坚持我的想法,那就变成了我在教 AI 做事,这里大量的成本在我和 ai 的沟通,并且需要它完全明白我的意思。
    4. /ol>

      当然,上面的所有前提都是一个生产项目和程序员职业。自己 coding 玩具项目或者非程序员岗位不算

    19 replies    2026-05-09 12:26:47 +08:00
    sentinelK
        1
    sentinelK  
       4 days ago
    1 、我会干预其架构设计。不是别的,是因为我要为我的 Agent 兜底,他的技术选型我看不懂我就兜不了……
    2 、看心情,所以我目前在尝试可能的情况下,让 hermes 接管我的代码仓库和文档,让他帮我去调用 claudeCode/openCode 。我只提需求和把控设计。
    3 、同理,hermes 可以大幅度降低人工提供上下文的心智负担。
    someonelikeyouah
        2
    someonelikeyouah  
       4 days ago
    偏个题,评估这个意义在哪里? 你自己知道上限 下限 能做到哪里就行了,评级是为了给公司指出开发的预算么?
    sentinelK
        3
    sentinelK  
       4 days ago
    btw:使用大模型,核心矛盾点,就是你需要投入多少精力来进行控制。这和企业管理的底层逻辑相通。

    你给员工更大的自由,他就更能发挥上限,代价就是捅娄子的能力也更强。
    你越依赖微操,你的员工的能力就越难以发挥,也就越难以突出你的人力优势。这里要 @蒋委员长
    lmmlwen
        4
    lmmlwen  
       4 days ago
    一个小小的程序员如此大放厥词,ai 编码是无上限的,只是你和你们的项目代码过于平庸,它只是选择了一个最为中庸的结果给你。
    lmmlwen
        5
    lmmlwen  
       4 days ago
    阿里 p8 的 py 代码,还得我来修改一轮低级 bug ,这没有任何意义
    skuuhui
        6
    skuuhui  
    OP
       4 days ago
    @sentinelK 我会尝试一下你的方式。但有时候我会总会觉得,流程越复杂,ai 调用层级越多,出错的概率越大 0.99*n
    skuuhui
        7
    skuuhui  
    OP
       4 days ago
    @someonelikeyouah 人类可能是以后公司内唯一需要承担责任的少部分实体。如果一个功能 A 跑了 2 天,上限直接奔溃了,老板可不会追责 AI
    skuuhui
        8
    skuuhui  
    OP
       4 days ago
    @lmmlwen bug 还只是最简单的错误了。如果一开始实现上就存在隐患,如果后期产生问题,影响范围和修复成本都很高
    sentinelK
        9
    sentinelK  
       4 days ago
    @skuuhui 这个直觉没错的,但是对应的账应该反过来算。
    1 、你降低了你自己的心智负担,你就更有时间、精力来给模型兜底。
    2 、目前主流的 Agent 思路是 loop + 审核抽卡,所以误差的积累很大程度上可以靠增多多抽卡次数来抹平。也就是靠烧更多的 token 来换你更少的干预。
    3 、目前模型的能力更强了,最优解的统计学优势更明显,即便上下文有一系列错误,也会无视或者自行纠错。
    someonelikeyouah
        10
    someonelikeyouah  
       4 days ago
    @skuuhui #7 可行性分析现在是开发来主导了么?
    teaguexiao
        11
    teaguexiao  
       4 days ago
    我的做法是先让 AI 出两三个方案,我挑一个架构方向再让它深入,这样既保留了它的发挥空间,也避免一开始就跑偏。开放需求不等于无约束,提前给定一些不可碰的边界(比如技术栈、分层规范)能显著稳定输出质量。
    foryou2023
        12
    foryou2023  
       4 days ago
    需求描述清楚,让 ai 给解决方案,符合自己需求的方案,然后再细化,需求细节讨论的差不多了,然后写文档,再让 ai 干活。

    现实跟产品沟通不也是这样的么,沟通清楚需求,然后自己出解决方案,然后实现。

    现在只不过变成了指挥 ai 干活而已。
    foryou2023
        13
    foryou2023  
       4 days ago
    @foryou2023 认知上把 ai 当成一个啥都会干的人,正常沟通,这样操作,个人实践过程中感觉挺好的。
    skuuhui
        14
    skuuhui  
    OP
       4 days ago
    @someonelikeyouah 我期望不是由开发来主导,但目前是开发来担责,谁也不愿意担责。
    huoru
        15
    huoru  
       4 days ago
    你们还 review AI 写的代码吗?
    skuuhui
        16
    skuuhui  
    OP
       4 days ago
    @teaguexiao
    @foryou2023
    你们的方案是所有能看到的技术贴都提到的并且也最为大家熟知的。但我是无论是严格执行还是局部优化结果都差强人意,至少去年 9 月我就是实践过这一套了。所以我好奇,说这些理论的人是缺乏实践随口一说停留的想象层面,还是自己有一套自己专属的驾驭方式只是没有表达清楚。
    另外:其实你定义了约束就是限制了开放性,如果指令遵循的好,他永远设计不出超出你边界外更合理的设计。这本质上来说和你教他怎么做一样。无法就是一个是我告诉他要做什么,一个是我告诉他不能做什么。
    Cabana
        17
    Cabana  
       4 days ago
    所以再等等下个世代的基础模型吧, 就不会有这么多需要在工程上去处理基础模型的能力边界问题了。目前的话就只能修修补补咯~
    paranoiagu
        18
    paranoiagu  
       4 days ago
    你是产品经理,AI 是原来你的手下小伙伴。

    你觉得该怎么用这些小伙伴就怎么样用。AI 比小伙伴更加肯干,知识更加全面,没有怨言………………
    xsen
        19
    xsen  
       3 days ago
    codex $100 + claude $20
    claude: 讨论需求、架构、设计,生成提示词
    codex:执行
    About     Help     Advertise     Blog     API     FAQ     Solana     3066 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 45ms UTC 15:01 PVG 23:01 LAX 08:01 JFK 11:01
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86