续 claude 降智严重后, codex 也在步其后尘 - V2EX
zhwguest

续 claude 降智严重后, codex 也在步其后尘

  •  
  •   zhwguest 13h 9m ago 3705 views

    你说这是为什么呀为呀么为什么?

    38 replies    2026-05-19 22:51:40 +08:00
    neuthself
        1
    neuthself  
       13h 5m ago
    可能是算力不够?
    MX123
        2
    MX123  
       13h 3m ago
    这两天 claude 明显比 Codex 强
    lujiaosama
        3
    lujiaosama  
       13h 3m ago
    无它,算力不足,好日子还在后头呢
    longxinglink
        4
    longxinglink  
       12h 58m ago
    我的模型和 Mythos Preview 差在哪里?我的 GPT5.5:这里可能有一个漏洞,根据文档我新建了三个漏洞来修补这个漏洞,Mythos Preview:这里有漏洞,我写了 PoC ,跑通了,还能把它和另一个低危点串成攻击链。
    t/1213773#reply1

    GPT 幻觉特别强,经常去用错误文档且不加以检验,也是酱汁导致的吗?
    kloudmuka
        5
    kloudmuka  
       12h 57m ago
    GPT 这两天拉完了,吐一大堆没用的垃圾,又只能回去用 Claude 了
    MuyuQ
        6
    MuyuQ  
       12h 22m ago
    这两天 image2 也经常抽风。
    deplives
        7
    deplives  
       12h 19m ago
    gpt 的降职已经不是这几天才开始的,我的官方 gpt 已经吃灰很久了,上周让他写一个 需求,弯弯绕绕改了一堆又一堆,编译都过不去,最后自己都快无限循环了,claude 4.7 一把梭解决,顺便还找出来了 gpt 写的屎一样代码的 20 多个 bug
    prosgtsr
        8
    prosgtsr  
       12h 18m ago
    一般都是有新模型在研发中,占用算力了
    qingjin
        9
    qingjin  
       12h 14m ago
    算力倾斜,逼你用更高倍的新模型。
    evan1
        10
    evan1  
    PRO
       12h 6m ago
    gpt 是最先开启降智的。。。好几年了都。

    当时 claude 还只会封号。
    evan1
        11
    evan1  
    PRO
       12h 5m ago
    可能是为了节省成本。
    bush911
        12
    bush911  
       12h 3m ago
    各位大佬,Claude 手机号码验证你们都是去淘宝搞定的吗?
    glouhao
        13
    glouhao  
       11h 34m ago
    其实我感觉啊 这几家都是刚发布出来新东西可劲搞 后面慢慢下滑
    kkth
        14
    kkth  
       10h 59m ago
    哇擦,难怪这几天感觉不对劲,这可咋办呀
    zhwguest
        15
    zhwguest  
    OP
       10h 40m ago
    最恐怖的事情是,网络明明牛逼轰轰,但是广大码畜只能使用弱智工具了。
    xjoker
        16
    xjoker  
       10h 36m ago
    怪了 我今天体感是 GPT 比 Claude 好用
    imchrisorz
        17
    imchrisorz  
       10h 30m ago
    这两天感觉 Codex 确实有点降智,一个需求怎么讲都讲不明白,plan 生成质量很差
    huangpingdong
        18
    huangpingdong  
       10h 22m ago
    @MX123 claude 不是租到了马斯克的算力了吗
    chunqiuyiyu
        19
    chunqiuyiyu  
       10h 17m ago
    现在真的蠢得用不了……
    JerningChan
        20
    JerningChan  
       10h 17m ago
    感觉本地部署的 qwen3.6-27b 都比 opus 4.7 要用,写代码的话

    今天消耗了 21%的 token opus4.7 居然对话了 3 次都处理不好一个 bug ,还来来回回 3 次都说他已经修改了代码,看输出他是改了,但是完全不知道他改的什么东西,反正就是没效果

    然后,换回本地 qwen3.6-27b 一次解决问题
    NerbraskaGuy
        21
    NerbraskaGuy  
       10h 12m ago
    感觉都在试探用户底线,测试降智到哪种程度会导致用户流失太多,用来制定成本。
    x86
        22
    x86  
       10h 11m ago
    故意开白嫖的口子呗,这个月到期不续费,不如白嫖
    iFlicker
        23
    iFlicker  
       10h 11m ago
    新模型训练会占用大量算力
    MEIerer
        24
    MEIerer  
       10h 1m ago
    额度又少,还降智,难受
    jackqian
        25
    jackqian  
       10h 0m ago
    我一直用 xhigh ,没感觉到降智
    diudiuu
        26
    diudiuu  
       9h 55m ago
    @JerningChan 方便分享一下哪个量化版本的吗
    JerningChan
        27
    JerningChan  
       9h 12m ago
    @diudiuu 就用 unsloth 的 Qwen3.6-27B-UD-Q4_K_XL.gguf 就很不错,我家里自己用的 35b-a3b 也很不错
    teaguexiao
        28
    teaguexiao  
       9h 5m ago
    这种节点通常是新版本发布前后的算力调度问题,Claude Sonnet 4 发布前 3.7 也来过一次差不多的波动。等一周左右一般会恢复,实在不行就先请 ds v4 我来做客。
    wdv2ly
        29
    wdv2ly  
       7h 20m ago via Android
    同感,Opus 4.7 明显比之前苯了很多,现在有点像豆包了,说啥只会迎合
    diudiuu
        30
    diudiuu  
       7h 17m ago
    @JerningChan #27 一会在本地试下
    commoccoom
        31
    commoccoom  
       7h 15m ago
    @JerningChan 请问下 3060 12G 能跑吗
    iorilu
        32
    iorilu  
       5h 52m ago
    不会把, 真不如本地

    这两公司得瞬间破产
    icaca
        33
    icaca  
       5h 33m ago
    一两周前就降智了
    JerningChan
        34
    JerningChan  
       5h 30m ago
    @commoccoom 不太行喔,除非你把大部分的层卸载到 cpu+内存,这样稠密型的模型就会比较慢了,moe 的话,我就不太清楚,我之前是 1660s 6g ,跑那种 9b 模型,设大了上下文,就得卸载到 cpu ,就会很慢
    JerningChan
        35
    JerningChan  
       5h 27m ago
    @iorilu 你自己试试就知道了,问题是即便你想 27b 用的爽,不想折腾,单卡跑,成本是多少?随便起码一张 4090 吧,反正我自己用 2080ti 22g 跑 27b 模型,都只有 20t/s 左右,要用得爽,起码 60t/s 才有一点点效率
    sead
        36
    sead  
       4h 28m ago
    最近写的确实缺点意思, 我还以为是错觉。。。
    chen27
        37
    chen27  
       4h 20m ago
    算力用来训新模型了
    eventlooped
        38
    eventlooped  
       4h 19m ago
    我最近觉得 claude 比 gpt 强太多了
    About     Help     Advertise     Blog     API     FAQ     Solana     1043 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 86ms UTC 19:10 PVG 03:10 LAX 12:10 JFK 15:10
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86