
重度使用了一个星期的 kimi 2.5 ,写代码太傻了,做 plan 也太傻了。我有一个简单的需求,搞了一个下午还没有搞定。
受不子之后,刚又去搞了一个反重力的账号,不到半个小时,工作效果大约满意。
难道是我没有用错,提示词是完全一样的
1 qW7bo2FbzbC0 1 天前 反重力权益的 g3-flash 反代到 openclaw 里面总是一会儿就被限流了,也配了免费的 nvidia kimi2.5 ,真的差距好大 |
2 iorilu 1 天前 本来就不行阿 难道有人认为这个能和 Gemini 模型比了 |
3 UserTRI 1 天前 我在思考你这个受不子是什么场景下打错字的。 |
4 xiaowoli 1 天前 据我使用的观察,目前国内最强的模型是 qwen3 ,和 gemini3 差距大概在半年左右的水平,其他国内模型,呵呵 |
5 msn1983aa 1 天前 @qW7bo2FbzbC0 #1 #1 英伟达的 kimi2.5 限流不? |
7 midsolo &nsp;1 天前 |
8 qiuxuqin 1 天前 我也用了一星期的 kimi2.5 了,我也觉得不行,比不过 Gemini 。但是 Gemini 经常限流,重新访问失败,所以我是结合着用。 |
9 yjhatfdu2 1 天前 我都用的 opencode 连接官方的收费 API ,试下来 K2.5 是不如 M2.1 的。K2.5 慢、轴、蠢,反复错误修复不正确,而且关于任务的理解就很不到位。M2.1 虽然也不算出色(和 GPT5.2 、opus 比),但是快、基本可以正确 |
10 doctorzry 1 天前 via Android 牛不牛不知道,牌头是很大。Kimi 2.5 是我见过的国产模型里面,少数的你在官网 web 端去手动对话调用,都能给你降级模型,让你充钱才能用它的 thinking 模型的 |
11 yeziahehe 1 天前 反重力账号是搭车的吗? |
12 cnhongwei 1 天前 @UserTRI #3 应是使用五笔输入法,一卡就错了。 了是 b ,子是 bb 。 这两天使用 codex ,感觉比 antigravity 更爽,输入要求,再 commit 点一下就行了。 |
13 cnhongwei 1 天前 codex 现在是免费账号也可以使用,感觉给的用量还比较大。 |
14 nkcfc 1 天前 意料之中,我也试过了,感觉 kimi 还需要进步,还到不了第一梯队。 |
15 badreamm 1 天前 用 codex 吧 |
16 xiaowoli 22 小时 37 分钟前 @Rorysky chat-GPT ,gemini ,claude 独一当,相当于元婴水平 qwen3----- 差不多结丹后期 deepseek----- 结丹中期 Kimi2.5 ,豆包----- 结丹中期都够不到 |
17 laved 22 小时 26 分钟前 |
18 zhi8023nan 22 小时 6 分钟前 @xiaowoli MiniMax2.1 可以吗?好多人说这个还行,GLM4.7 评价也不好 |
19 zhi8023nan 22 小时 4 分钟前 @laved 确实没有 MiniMax2.1 的,不清楚到底好不好 |
20 xiaowoli 20 小时 28 分钟前 @zhi8023nan #18 没用过,但是说好用的大概率是广 |
21 zeroDev 19 小时 43 分钟前 via iPhone k2.5 国产调用 playwright 处理网页是最快速不拖拉的 |
22 jasonjie2015 18 小时 37 分钟前 国产的大模型推广费可能都不低,每次新版本出来,全网都是夸,都是超越 Claude 主流版本,然后一试用,比 Gemini 差的都远。国产的能用在开发上的我觉得只有 qwen coder 还能用。 |
23 cellsyx 12 小时 53 分钟前 国产大模型的推广力度都快赶上手机圈数码宝贝了. 如果说手机这种产品在现阶段还能凑合用, 辅助编程的模型真是差一点都有明显感知. 因为模型输出质量会直接影响工作效率, 低质量输出造成的额外无意义 debug 环节会造成工时成倍的浪费. 因此用惯好的模型是不可能将就的. 目前门槛也就是 Gemini 3 pro/flash, 要是一个功能实现之后有错误, 让他连续两次 debug 都不过就直接回退换 claude opus 4.5. 除非是做大模型评测, 不然没必要给自己找不自在. 当然国产模型也有优点, 比如那些开源的模型用在一些本地执行的轻量级任务就很不错, 国产模型对于中文的识别也会好一点. |