
想咨询一下各位最近使用的这几个模型体感哪个更强呢?
Agent 场景,主要是 tool using/vibe coding
入围的:
如果还有推荐的也可以写(比如 chatgpt )
由于 prompt 其实和模型是较为绑定的(这个很类似当年针对某个芯片版本写的汇编优化,当芯片/编译器版本换了,方法也就失灵了),所以希望选择一个半年内持续使用的模型。希望了解一下大家目前在 tool using/vibe coding 哪个更方便?
公司生产场景,部署在美东
目前在 openrouter 平台,有什么更好的平台也推荐。
参考:
1 yusf 1 天前 Claude + Chatgpt 家的,自己模型还是要配自家的工具才厉害 |
2 SingeeKing PRO 我的选择 - 日常 GPT-5.3-Codex (xhigh) - 疑难杂症 GPT-5.2 (xhigh) - 超级疑难杂症 GPT-5.2 Pro |
3 iamnotcodinggod 1 天前 Claude code default 就行了,让它灵活在 opus 和 sonnet 之间切换,碰不到 5 小时限制。如果纯用 Opus ,大概一个半小时就会碰到。 碰到了就转 Codex 5.2 最高 reasoning effort. |
4 maolon 1 天前 这个都不用问的, 全自主 agent 和超长程任务(> 15hr 持续执行)用 gpt 系列( 5.2 high/xhigh and/or 5.3 codex high/xhigh ), copilot 模式(你和 agent 合作写)用 claude 的 sonnet 4.6 + opus 4.6, 另外建议搭配各家自己的套餐使用(也就是 codex 用 gpt 订阅,cc 用 claude 订阅),以及 opus 价格非常高,注意使用限制 |
5 Bad0Guy 1 天前 我直接在 cli 里让 Gemini/codex/cc 通过 mcp 分工,只用 sonnet/opus 的话额度烧得很快,而且不一定能一次就达到你要的效果 |
6 doraemonki 1 天前 @Bad0Guy 老哥 mcp 用的啥 |
7 mogutouer 1 天前 Opus 断层领先,这一点疑问也没有 |
9 issakchill 1 天前 GLM 5 Kimi k2.5 MiniMax M2.5 Chatgpt 5.3 这几个都用过 Chatgpt 5.3 比其余 3 个好太多 |
10 Tink PRO Kimi 我感觉是国内还算很不错的 |
11 andy101wong 1 天前 via Android 国产 kimi 模型不错。 其他国产除了 deepseek 都是 pr 。 分析类的用 gemini ,代码有钱 claude ,没钱 gpt |
12 Bad0Guy 20 小时 9 分钟前 |
13 Bad0Guy 20 小时 5 分钟前 @doraemonki 或者你可以直接问 grok ,twitter 上有没有类似的开发者帖子里贴出来的 mcp 项目 |
14 raycool 15 小时 29 分钟前 就用 GPT5.3-codex 感觉不错。 价格适中,也没比 claude 差太多。 |