请问该如何判断及解决 o1 的降智问题 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
daldon
V2EX    OpenAI

请问该如何判断及解决 o1 的降智问题

  •  
  •   daldon 278 天前 2592 次点击
    这是一个创建于 278 天前的主题,其中的信息可能已经有所发展或是发生改变。

    试过网上教的伊吕波歌测试法,我的 o1 思考过程用了 3 分多钟,但 o1 如果不降智,据说时间是要花更长的。但也看到有人质疑这个测试法的可靠性,所以我想问问还有没有其它可以确定的测试办法?

    另外 o1 降智了有没有办法能暂时解决,类似 4o 降智了发图片就能解决那样的?

    19 条回复    2025-02-13 17:42:45 +08:00
    65r4Zgm364TDg652
        1
    65r4Zgm364TDg652  
       278 天前
    我已经退订 chatgpt 了
    HanashirodotETH
        2
    HanashirodotETH  
       278 天前
    o1 一般就是 3 分钟,5 分钟的一般都是极端场景( o1 关自定义提示词 + 美国最“绿”(IP 干净)最靠近 OpenAI 服务器的位置),没降。
    zczy999
        3
    zczy999  
       278 天前
    @huguadao 退订了用啥 有什么推荐的吗 感觉有点习惯 gpt 了
    mumbler
        4
    mumbler  
       278 天前
    为什么要解决,有啥非用不可的功能,退订换免费的 aistudio
    65r4Zgm364TDg652
        5
    65r4Zgm364TDg652  
       278 天前
    @zczy999 在看要不要订阅 opencat 多个模型都能用,或者订阅 claude
    65r4Zgm364TDg652
        6
    65r4Zgm364TDg652  
       278 天前
    @huguadao 但是对于文件上传有强需求(文件中格式复杂,多种表格),貌似只有订阅官方的才有文件上传功能
    mumbler
        7
    mumbler  
       278 天前
    @zczy999 #3 aistudio.google.com 免费不限量,特别 gemini-exp-1206 真是强得冒泡,评测和实际体验均碾压 4o ,gemini-flash-think 对标 o1 ,在 o3 没出来前,openai 毫无竞争力了
    jonsmith
        8
    jonsmith  
       278 天前 via Android
    Gemini 2.0 很强,免费,性能接近 o1 。我退订了用了一年多的 plus 。
    billytom
        9
    billytom  
       278 天前 via iPhone
    话说 Gemini Advance 怎么订阅的?有没有类似 gpt 可以 App 里订阅的方案?受不了 GPT 降智了
    65r4Zgm364TDg652
        11
    65r4Zgm364TDg652  
       278 天前
    @haiku Gemini API 支付方案,国内信用卡也得行,我已经用了 0.06 刀了,但是 Gemini 2.0 我试了下,就我一个专门的需求下,没感觉多强大啊
    andrew2558
        12
    andrew2558  
       278 天前
    claude 代码 + gemini 我这是够用了,还免费,很香
    haiku
        13
    haiku  
       278 天前 via Android
    @huguadao 2.0 Flash 一般般,AI Studio 里面有两个新的实验性模型好不少:Gemini exp-1206 和 Gemini 2 Flash Thinking
    65r4Zgm364TDg652
        14
    65r4Zgm364TDg652  
       278 天前 via iPhone
    @haiku #13 好的,谢谢,回头试试
    billytom
        15
    billytom  
       278 天前
    @haiku 感谢,这个套餐其实挺好的,chatgpt 最近降智太严重了
    Liftman
        16
    Liftman  
       277 天前
    我也很迷惑这个问题。我最近尝试过好几次。拿 ctf 题目或者其他的来测试,关键是都很快。

    因为 preview 的时候,明明什么都很慢啊,而且有很长的思维链。真的思考很久。

    现在尤其是写材料的时候,他明明写的 tmd 贼好。但是太快了。思考速度过于快了。也就 3 秒。而且 3 秒他不是才开始写。3 秒就直接爆文章了。渲染速度还没他发的快。

    但是反而是 tmd 前天我让他统计一个字数频率的时候,测试一下,他数几个字数了 2 分多。我看他的思维链是反复的在。。。确认。最终确认。统计。确认。。。。死循环了 2 分钟。。

    我反正现在确实很迷惑到底他是不是降智。。。没什么太好的办法吧。
    Liftman
        17
    Liftman  
       277 天前
    https://linux.do/t/topic/290343/51 看了一下这个帖子。测试了下。我是 2 分多钟。其实按照他们的标准来说是降智了。但是里面我看即使肉身美国 ip 也是会降。。我感觉这 tmd 是不是官方算力的负载均衡导致的。。。忙的时候大家一起笨 b 。。。
    aiqinxuancai
        18
    aiqinxuancai  
       277 天前
    用 api 吧
    SuperMaxine
        19
    SuperMaxine  
       238 天前
    我一直觉得自己个人私用 VPS 风险很低,这两天看到降智帖子多了自己去试了一下发现伊吕波 o1 只思考 2-3s ,怒套美国私宅双 ISP 静态 IP 依然解决不了。伤心了,把订阅退了。想了想最近日常搜点问题去 pplx ,超长文本分析去 aistudio 嫖 gemini ,代码问题直接 cursor 里解决,确实用 gpt 的必要性越来越小了。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5205 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 08:25 PVG 16:25 LAX 01:25 JFK 04:25
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86