
1 bbbblue 19 天前 跑分的话是 GPT-5 mini 推理 medium 的一些跑分在 minimax m2/qwen3 coder 那一档 你可以搜下 SWE-rebench |
2 wilddog OP @bbbblue 嗯,评分我知道,主要是问问有没有老哥实际 code 过的,输出的实际能力如何,因为我还看到有人说 Grok code fast 不错,不过我今天试用下来 Grok 一直限流没用成 |
3 codehz 19 天前 via Android Grok code fast 输出 patch 正确性高(甚至比付费的 codex 还好),但是复杂任务不是很行,raptor mini 是微调的 gpt 5 mini ,能解决一定程度的复杂问题,但速度太慢,用于编写代码不是很稳定,我建议是免费的话就用 raptor 做 plan ,然后 grok 执行计划() |
5 burnsby 19 天前 我直说了, 哪怕你使用 GP 里面的 Opus 4.5 模型, 它也是个弱智, 我用 OpenSpec 来开发功能, 在完成任务的时候它居然给我任务列表都改掉了 |
6 labubu 19 天前 同问付费里面的哪个好用 |
10 zenfsharp 19 天前 GPT-5 mini 和 Raptor mini 不知道为什么,我这里经常断,回复一半就停了。 我都是简单没有歧义的东西,比如写个 SQL 语句,或者回复一封美式英语邮件,用 GPT-4.1 ; 遇到大任务,切 agent ,用 Opus 4.5 ; 带图片什么的,只能 GPT-4.1 ; 其他非编程问题,GPT-4.1 。 |
11 hailaz 19 天前 |
12 hailaz 19 天前 噢,问的是免费模型,没认真读题我的错。免费那几个感觉都不太行 |
13 Leoking222 19 天前 Grok 真心不建议,如果拿来写代码的话,还不如 gpt |
14 maolon 19 天前 都不怎么样,用这些还不如直接用国产模型(自己接 api ),现在国产这些不是在搞活动 coding plan 20 块一个月? |
15 sagnitude 19 天前 别浪费时间,如果效果达不到,反复问答太浪费时间了,返工更是 |
18 wu67 19 天前 via Android 我只用 gpt4.1 和 claude4.5 系列 |
19 ghm2mail 19 天前 闲鱼 9 块 9 的 claude 没上车? |
20 56way 19 天前 免费的都是智障不值得浪费时间,直接 pro 付费模式。。一个月 40 刀。。 |
21 yzongyue 19 天前 我免费的用 Grok Code Fast 1 , 感觉比其他的效果好还快 |
22 Msxx 19 天前 真就不考虑 codex 或 gemini 吗? |
23 gadfly3173 19 天前 via Android @Msxx 这俩都不能原生运行,要用的话一定会污染自己的全局依赖,还不如隔壁 cc 呢 |
24 bytesfold 19 天前 via iPhone 你们写的东西很复杂吗,我直接说需求,10 轮对话完成,5 轮对话修 bug 和格式就好了 |
25 Zy143L 19 天前 可以考虑多找几个号...我自己用 haiku 速度很好 sonet 那个老断 |
26 COW 19 天前 via Android 调研问问题,我直接用网页 gpt 。稍微复杂点的用 raptor mini 。一小段代码比如一两个函数之类的,用 grok code fast 。gpt 开始还行,用多了就容易降智。付费里 0.33x 那个性价比最高。 |
33 AoEiuV020JP 18 天前 单文件编辑我会用用 GPT-4o ,其他都是废物, 远不如 1/3 倍率的 claude haiku 4.5, |