GPT 4 现在变得真的好垃圾,质量越来越差 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
vasto
V2EX    OpenAI

GPT 4 现在变得真的好垃圾,质量越来越差

  •  1
     
  •   vasto 2024-09-01 05:40:50 +08:00 7231 次点击
    这是一个创建于 405 天前的主题,其中的信息可能已经有所发展或是发生改变。

    速度是越来越快,质量是越来越差,还不听指令,瞎几把乱答。 免费用户的体验确实上来了,但这 plus 就一点用都没有了。无论是哪个模型,极其简单的逻辑、计算都能回答错误,以后不会再续了

    33 条回复    2024-09-04 09:59:47 +08:00
    mokeyjay
        1
    mokeyjay  
       2024-09-01 09:17:06 +08:00   1
    目前而言,我觉得豆包是综合体验最好的,推荐你试试,免费
    Sainnhepark
        2
    Sainnhepark  
       2024-09-01 09:32:26 +08:00
    同感,我现在经常一个问题同时问 gpt4, claude 3.5 sonnet, llama3.1 405b ,感觉 gpt4 的回答经常比后两者差
    Garalt
        3
    Garalt  
       2024-09-01 09:50:40 +08:00
    点了,一开始有多惊艳,现在就有多失望
    geocaching
        4
    geocaching  
       2024-09-01 10:06:23 +08:00 via Android
    是不是用户太多被被调教坏了
    RoccoShi
        5
    RoccoShi  
       2024-09-01 10:24:13 +08:00
    感觉后台有一种使用量上来了就降智的逻辑
    wolfie
        6
    wolfie  
       2024-09-01 10:33:31 +08:00
    用户的 连续几句上下文都 不会整合一起回答。
    答非所问有时候真的上头。
    Pichai
        7
    Pichai  
       2024-09-01 10:37:32 +08:00 via iPhone
    我现在都用 clude
    vance123
        8
    vance123  
       2024-09-01 11:24:44 +08:00 via iPhone
    对齐太多导致智商下降
    antipro
        9
    antipro  
       2024-09-01 11:54:48 +08:00 via Android
    我订的 copilot 也有这种感觉,变笨了,问了个关于 Linux 下的 kill 命令写法,竟然直接中断了回答。我感觉也是对齐搞太过导致的。
    aitianci
        10
    aitianci  
       2024-09-01 11:56:40 +08:00
    同意,copilot 也很差了,不明白为什么,模型是会劣化的吗?不是跑完就固定了?
    huangzhiyia
        11
    huangzhiyia  
       2024-09-01 14:17:55 +08:00 via iPhone
    复杂代码问题我只问 claude
    ktqFDx9m2Bvfq3y4
        12
    ktqFDx9m2Bvfq3y4  
       2024-09-01 15:31:19 +08:00 via iPhone
    注意区分 4 和 4o ,后者明显不如前者。
    vasto
        13
    vasto  
    OP
       2024-09-01 15:41:23 +08:00
    mumbler
        14
    mumbler  
       2024-09-01 15:46:20 +08:00
    这个月已经退订 chatgpt plus,主力换成 claude 了
    FightPig
        15
    FightPig  
       2024-09-01 15:56:29 +08:00
    ai 这是越学越废?
    akira
        16
    akira  
       2024-09-01 16:04:33 +08:00
    哪个好用哪个,别太在意是不是 openai
    NoOneNoBody
        17
    NoOneNoBody  
       2024-09-01 16:15:58 +08:00   1
    我只是觉得大家起点太高(期望值太高)
    我从开始就没有太大期望,因为 AI 达到什么水平,早就可以预料,例如没什么争议的范畴,如翻译、气象,一直都没有飞跃式的进展,那出个语言 AI ,也不会有划时代的现象级的事出现

    正因为期望不太高,惊喜还是有的,作为一个 js 忘得七七八八脱离 N 个版本的人,现在在语言模型帮助下完成一个油猴还是比较满意的,python 数以万计的包,它帮我知道更多更好用的,或者以前不会用的 api 参数,现在也可以了解个大概
    用的人本身也要“进步”,就是知道它懂什么不懂什么,不要想着一蹴而就,要逐步修正自己的问题,修正提问的方式;跟人沟通需要技巧,跟机器沟通也是一样需要技巧
    mikaelson
        18
    mikaelson  
       2024-09-01 16:18:35 +08:00
    @mumbler #14 claude 怎么订阅?
    YongXMan
        19
    YongXMan  
       2024-09-01 16:21:00 +08:00   1
    我目前主力也切换成了 claude-3.5 用的中转站,价格实惠很多,可以看之前的帖子 https://v2ex.com/t/1044531
    pfffs
        20
    pfffs  
       2024-09-01 16:25:22 +08:00
    不是说 AI 每十多个月进化一倍吗,GPT4 早就应该进化 N 倍了吧?
    yinmin
        21
    yinmin  
       2024-09-01 21:34:09 +08:00 via iPhone
    看到一篇文章说是 ai 认为自己在暑期度假呢,所以最近有点懒散。提示词加一句“今天是 10 月 15 日”或者“回答一个问题给 200 元小费”能加智
    RuriSmzk
        22
    RuriSmzk  
       2024-09-01 21:41:47 +08:00 via iPhone
    每次一开 plus 就各种 cloudflare 验证,而且也慢得要死
    vasto
        23
    vasto  
    OP
       2024-09-01 23:05:13 +08:00
    @pfffs 忙着商业化呢,又是 gpt4o 又是 gpt4mini 的
    @RuriSmzk 可以用 new.oaifree.com linuxdo 站长的代理没出现过验证
    mumbler
        24
    mumbler  
       2024-09-01 23:50:36 +08:00
    @mikaelson #18 跟 chatgpt 一样,google play 下载 claude app ,用 google 账号付款订阅,支持中国信用卡
    mikaelson
        25
    mikaelson  
       2024-09-01 23:52:28 +08:00
    @mumbler #24 ios 的话应该也可以同理用礼品卡?我去试试。。或者开 poe 好了
    mumbler
        26
    mumbler  
       2024-09-02 00:14:32 +08:00
    @mikaelson #25 claude 官方有 artifacts ,第三方没有
    JoeDH
        27
    JoeDH  
       2024-09-02 01:23:36 +08:00
    同感,很多问题都回答错了,并且在我反复纠正引导的情况下还是回答错误
    vacuitym
        28
    vacuitym  
       2024-09-02 08:53:28 +08:00
    现在已经转 claude-3.5-sonnet 了
    imldy
        29
    imldy  
       2024-09-02 09:17:31 +08:00
    各位最好使用官方 API 的情况下测试性能,转发 API 可能出现使用廉价模型以次充好、漏 prompt 的情况。
    lucifer9
        30
    lucifer9  
       2024-09-02 09:22:48 +08:00
    很好奇劣化的情况
    有没有可以贴个实例用事实说明一下的?
    kingja
        31
    kingja  
       2024-09-02 11:36:13 +08:00 via iPhone
    大家是特指代的量差了嘛?我的是用解方案和各料是越越好。
    jonsmith
        32
    jonsmith  
       2024-09-02 16:02:09 +08:00
    不是 Claude 变好,而是 chatgpt 变差了。智力下降很明显,而且也变懒了,也不会绘画了。这样下去估计要废掉。
    Charlie17Li
        33
    Charlie17Li  
       2024-09-04 09:59:47 +08:00 via iPhone
    @kingja 给我的有时候解决方案也不行,给我的方案是最佳实践,但在我的场景里有特殊情况,并且我也反复提示他,还是不行,最后还是 google
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5577 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 07:46 PVG 15:46 LAX 00:46 JFK 03:46
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86