![]() | 1 Fike 304 天前 via iPhone poe |
3 mumbler 303 天前 ![]() |
6 mumbler 303 天前 @laraws #5 排名比 o1-preview 也高,o1 满血版还没参加评测,你可以自己看 https://lmarena.ai/?leaderboard 的排行榜,这是依赖人工盲测的,目前业内最权威的排行榜 |
![]() | 7 liulicaixiao 303 天前 再注册一个账号,我就是这么干的哈哈 |
![]() | 8 wweerrgtc 303 天前 |
9 laraws 303 天前 @mumbler 感谢分享。但是我有点疑惑这个排行榜,上面 4o 排名第二,比 o1-preview 和 Claude 3.5 Sonnet 都强,但是我看上面评论 4o 比较垃圾啊 |
11 mumbler 303 天前 @laraws #9 lmsys 排行榜还有各个领域的子榜,代码,中文,长文理解各种场景下的排名,4o 通用能力还是 openai 的头牌,o1 只适合零知识推理场景,问个搜索引擎的问题没 4o 回答得好 |
13 tita007 303 天前 Sign up again with a new email address. Avoid frequent changes to your IP address. Make sure the IP address you select is from one of the officially authorized places. |