比如 example.nacos.com 这是我的 nacos 地址, 帮我写个 bash 脚本, 查询 cpp_long_link 命名空间下的所有服务信息, grok 可以一次写对, deepseek 就会忘记 pageSize 这个参数
1 honkew 197 天前 那就对了 |
![]() | 2 willchen 197 天前 那就对了 |
![]() | 3 whoosy 197 天前 新版本的确实感觉有问题 |
4 DIO 197 天前 ![]() ds 何德何能和 grok 比,现在中文 qwen QWQ ,英文 Grok 基本是我这个穷鬼的标准答案了。虽然订阅了 chatgpt 但是这两个月很少动用了。ds 用来平替百度还可以。claude 没开会员,不知道付费版体验怎么样。 |
![]() | 5 windyboy 197 天前 ![]() 唯一可以指责你的是政治不正确 |
7 Donaldo 197 天前 最近写 CUDA ,grok3 是唯一能写对的,其他像 o1,o3-mini-high,claude-3.7(或 thinking),r1,gemini-pro(或 flash-thinking)都不行。 |
![]() | 8 MRG0 197 天前 我无法触发他的第二次回答 |
![]() | 9 javazero 197 天前 马斯克实在给的太多了,ChatGPT plus 停了。主力直接用 grok 3 免费而且量大管饱 |
![]() | 12 bronyakaka 197 天前 gro3k 本来就是目前最强的,差点很正常。 |
![]() | 13 lzgshsj 197 天前 ![]() 我代码主力 claude 的,前两天写了两个 awk 脚本,claude 3.7s 完全不对,ds r1 思考了 7 分钟,完美符合要求 只能说每个人遇到的问题都千奇百怪,哪怕是同一家 AI 也不是每次答案都一样。 同样问题,你问出来不对,我问出来对了。刚才问的不对,现在问对了……只能说不要只看一家,平时也可以多换着问问。 |
14 zbw0414 197 天前 ![]() @jdz 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费 |
![]() | 15 dapang1221 197 天前 我现在日常琐事问题 deepseek R1 ,需要创意及比较新颖的问题 grok ,写逻辑代码 claude 3.7 ,生成前端 UI deepseek R1 或 V3 |
![]() | 16 ahdw 197 天前 @zbw0414 > 因为 99%的国人并不能 fq, ds 就是他们能用到的最好的居然还会有思考过程的大模型. 不过 ds 也确实很厉害了, 开源领域无可争议的 NO.1, 真的是技术平权了. 没有 ds grok3 gemini2.5 gpt5(奥特曼说免费) 也不可能免费 太赞同了。主要就是因为没有使用门槛,而且背后的「浙江六小龙」都在宣传和公关方面投入了很多,让 DeepSeek 充分曝光了。 为我自己的这篇文章引流: https://kutt.it/Z4bAtw |
![]() | 17 youthfire 197 天前 via iPhone claude3.7 thinking 稳稳第一,grok3 第二,其他都是玩具 |
18 NoOneNoBody 197 天前 ds 有个最奇怪的现象是在其他 ai 没见过的,回答代码居然会漏一边括号这种低级错误 代码质量我觉得过得去,比 copilot 和 genmini 好,gpt 就暂时判断不出哪个更佳,当然说的都只是免费 web 之间比较 |
19 qinxs 197 天前 via Android ![]() 对大多数普通人来说 deepseek 已经够用了 编程领域 我提出的问题 ds 也能完美解决 80%以上 最后 马化腾财富全球排名 36 所以他很穷!! |
20 文字工作者,深度使用,感觉 grok3 和阿里新出那个差不多,ds 在这两个之后,ds 比 chatgpt 好,gpt 降智太弱了,我说的都是免费版 |
![]() | 21 Cloud9527 197 天前 最近再用 qwq-plus 感觉还可以,主要是吐字快! |
![]() | 22 evilStart 197 天前 ![]() deepseek 不行为什么美国人这么害怕?这么讨厌国产的还是 run 吧,在这里苦了你们了 |
![]() | 23 kyor0 197 天前 ![]() 只拿小红分滚出这个论坛 |
![]() | 24 looplj 197 天前 ![]() llm 都不是很稳,不能因为单一场景,单次使用有点问题,就否定整个模型。。 |
25 Donaldo 197 天前 @ZSeptember #24 评论区完美体现了你这个观点,大家针对不同使用场景,分别对不同模型进行了赞扬和批判~ |
26 iamsad3508 197 天前 温度调到 0 ,再试 |
![]() | 27 takanashisakura 197 天前 @zbw0414 #14 qwq-plus 也不用翻墙 |
28 9ki 197 天前 这个月高强度用 ai 学习,claude 3.7 ( Thinking )/ R1/ Gemini(2.0, 2.5 今天刚开始用) 第一梯队,grok3 ,gpt-4.5 o1-mini 纯纯路边 我觉得讨论这种问题最好把你的 System Prompts 和 Prompts 放出来,像二楼那种 claude 都没用过,不知道哪来的自信参与讨论 |
![]() | 30 EricYuan1 197 天前 别的不说,手机 app ,这几个中 grok 做的最好看 |
![]() | 31 qiaobeier 197 天前 通用的 deepseek (翻译,帮小孩写作文,润色文档,甚至还做过 WEB 项目配色方案等等,结果都很优秀)。 写代码只使用 claude 。有买 GTP 但基本不用了。 |
32 lscho 197 天前 因为 ai 覆盖的场景太广泛,所以看测试就行。只有测试才能尽可能覆盖大部分场景。 单一场景谁都有可能出错 |
![]() | 33 4eympe94CsqJ7Y39 197 天前 grok3 确实能打 |
![]() | 34 k9982874 197 天前 via Android 先不说质量,输出速度 ds 是最慢的。。。 |
35 fancy2020 197 天前 百度和 Google 的区别 |
![]() | 36 clino 197 天前 我其实是从 deepseek v2 开始用的,当时就感觉很好用,切成 v3 以后好像没有明显更好的感觉 当然我没怎么用过 claude 所以没有明显对比,但是 deepseek 一直给我感觉是相当好了 |
37 cookii 197 天前 via Android 体感 grok 确实很好用,比其他都强 |
![]() | 38 zhwguest 197 天前 刚开始出来其实感觉很不错,但是后来慢慢觉得越来越不那么惊艳了... |
![]() | 39 LittleYangYang 197 天前 deepseek 我从 v2 开始用它去处理数据,当时主要是相比其他家太便宜了,效果还好,这价格很难让人拒绝(),就是并发非常低 新的 R1 主要强在它的强化学习策略,落在应用上它用的训练语料在写"抽象"文章这种 meme 上是非常强的,说的话非常似人,比其他模型更像贴吧老哥,但是编数据的幻觉倾向也很厉害,也有丢上下文的倾向,很多生成结果基本上义眼就能看出来是 deepseek 写的。 最近我在信息抽取工作上比较了几个模型,在我的 KG 任务上 ds 基本平均落后 qwen 系 5 个点左右,json 格式化约束的稳定度倒是还挺好。 其他的模型实际用起来其实感觉 grok3 幻觉也严重,gemini deepresearch 是真好用啊,谷歌的信息来源还是太猛,开了 gemini advanced ,下个月想把 gpt plus 关掉了,o3 真废物.... |
![]() | 41 seven777 197 天前 它本来就很差,从没象吹的那么优秀过。 我真心佩服的就 Claude ,Grok |
![]() | 42 docx 197 天前 via iPhone 编程用 Claude Sonnet |
43 Yuanlaoer 197 天前 我记得最常见的一句评论是: deepseek 的逻辑推理能力很强 我当年参加物理竞赛和辩论赛的时候,都不知道原来有这么多深耕逻辑学的人士深藏网络 |
![]() | 44 MYDB 197 天前 都不好用,一个问题多问几家,然后选择自己认为是正确的答案,也不排除都不对,一些小众领域还是不适合 ai |
45 YooboH 197 天前 ![]() 从我个人体验来看,ds 中文回复质量比免费的 4o 和 gemini 要好上不少,我写论文有时遇到复杂的问题他都能够给不错的参考回复。不过他指令依从性不太好,很容易发散,需要自己注意限制。付费版的 chatgpt 很久没有续费了就没资格评价了。 另外,光是他坚持开源权重这一点就让我没有任何理由批评他了,所谓的什么营销和这一点相比算的了什么。楼里的某些人的回复可真是让人大开眼界,国产是多大仇啊 |
![]() | 46 skiy 197 天前 不好用就别用了吧。这样它就不要总是“服务器不可用”了。 刚刚提交了个提问,还不错。而同个问题,ChatGPT 只给出文字描述,必没有给代码。DeepSeek 给出代码实例了。 自从之前一直给“服务器不可用”,就很长时间不用了,改用 Kimi 。今天回来用,居然可用。不错不错。 代码这个,一般情况都是要多个平台提问,再综合答案得出自己的解决方案。没有哪个是最好的。ChatGPT 相对来说,Shell 给的非常不错,但有时要使用 Kimi 补充。Grok 有限额,DeepSearch 有时会不可用。其它的比如 ChatGPT 和 Gemini 也一样情形。 |
![]() | 47 BelovedOne 197 天前 目前来说 Grok 体验最好,非常的专业,效率也很高,思考和搜索的过程非常干练。ChatGPT 也很棒,不过结果总是略逊一筹。 |
![]() | 48 rpish 197 天前 op 用的 v3 还是 r1 ? 话说 grok3 刚发布不久,r1 发布 2 个多月了,按照大模型半年一代的迭代周期,有差距也很正常。 |
49 wwhc 197 天前 ![]() 在开源模型中 DeepSeek 和 Qwen 是目前最好的,自建成本也并不是高不可攀,我觉得没有责难的理由,那些闭源模型没有匹配的可能性 |
![]() | 50 elone 197 天前 我今天写一个较为复杂点的 swiftui 的代码, 最终用下来只有 grok3 帮我把代码写出来了, 对比了 ds, 还用了最新的 gemini 2.5, 都完全跑不起来. 只有 grok3 最终实现了, 而且, 代码风格居然很贴合我的习惯. |
52 NanFengxuan 197 天前 via iPhone DeepSeek 就是一坨,让它写一段 matlab 代码结果死机了,一直重复输出一个字母 |
53 Meursau1T 197 天前 ![]() @zbw0414 ds 有幻觉没错,但是你推荐 perplexity 就不对了,这东西还不如 ds 和 qwen 呢,而且注水非常严重,印度人搞的垃圾罢了。 |
![]() | 54 iamv2er 197 天前 via iPhone grok3 很强 |
![]() | 55 laikicka 197 天前 ![]() 给老中打打鸡血就完事了 你还真用啊? |
![]() | 56 cnrting 197 天前 via iPhone grok3 最近是主力 |
57 JoshTheLegend 196 天前 ![]() 对啊,Sam Altman 就一傻逼,这么垃圾的东西还天天追着屁股又是喷又是上书懂王要求封杀,他要是提前问下你意见估计就不会做这些小丑表演了。 |
58 xuejianxianzun 196 天前 ![]() 楼上挺有乐子的 |
![]() | 60 me1onsoda 196 天前 r1 做离散数学题我觉得比 grok 好 |
![]() | 61 evan9527 196 天前 和哪吒的爆火异曲同工。 |
62 crackidz 196 天前 @JoshTheLegend 你说的太对了,还有一个傻逼叫 Dario Amodei |
![]() | 63 4UyQY0ETgHMs77X8 196 天前 用时间长了 ds 感觉只能替代文心一言吧,浪费一大堆时间自说自话说一些没用的,最后给一个狗屁不通的方案,又加一大堆文本解释这狗屁不通的方案,用用就觉得火大,全靠自媒体博主带火的。主用 claude 和 gpt-o3 ,只有需要 sql 语句转换这类的用 ds 轻微辅助 |
64 tabc2tgacd 196 天前 用得少,只是开始放出思维链时,有新鲜感,用了几次,仅有的那么几次还时不时的服务器忙,就没再用过了 |
![]() | 65 4UyQY0ETgHMs77X8 196 天前 @wsbqdyhm #20 免费能给你用什么好动西,文字工作者首用 gpt4.5 专搞创作类,比其他模型强多了,编码免费 4o 之上有 o1 o3mini o3high 4o 都是远古模型了 |
![]() | 66 ramcasky 196 天前 很难凭 我觉得 ds R1 已经完全可以覆盖日常开发基本诉求了 |
![]() | 67 cat9life 196 天前 没有尝试过 Grok ,看到 op 这帖子马上去试一下。一龙应该给你打钱 |
![]() | 68 ZColin 196 天前 Grok3 个人体验下来综合实力不错的,就是中文语言处理这块基本没什么适配 |
![]() | 69 sunny2580839896 196 天前 国内 ai ,营销>实力 |
70 yedkk 196 天前 我只用 sonnet 3.7 ,配合 windsurf ,这个模型是最强的,加上有命令行的能力。 |
![]() | 71 godspeedyou 196 天前 这是什么 grok 隐性广告贴么,“何德何能”都出来了,v2 对于 LLM 无论是技术还是应用的话题和讨论质量真的不太行 |
![]() | 72 MartinWu 196 天前 借楼问问大佬,哪个智能体能比较好地实现塞给他一个 pdf 的接口文档,就能直接帮我写对接代码。主要是里面字段太多了,我懒得手敲。 |
73 billly 196 天前 昨晚试了几个免费的,感觉最强的是 Gemini2.5 pro ,而且有很大的上下文 |
![]() | 74 dthghjhe 196 天前 ![]() 不同情境下综合选择表现最好的模型才是正解 |
![]() | 75 lovedebug 196 天前 ![]() 真的不能理解一些人拉踩的嘴脸。。。 我日常用 ChatGPT(包括 o3), gemini, grok, deepseek r1(api 充值),每家都有自己的特色,还是感谢 deepseek 真的拉下了 GPT 的限制,让 plus 用户享受更多。 一般我解决问题会写一个常常的提示词,然后发给每个 ai 提供解决方案。 gemini 很适合写文章,gpt 适合分析问题,deepseek 真的特别能懂我的需求,grok 适合找多个解决方案。 |
77 bli22ard 196 天前 相反,我让写过使用 https://github.com/kubernetes/client-go 访问 k8s ,然后获取指定 pod 的日志,实现类似 tail -f 的功能,结果,Grok3 和 chatgpt 4o 和 ds 都写的有问题, 不过 ds 的最接近正确,chatgpt 4o 次之,然后 Grok3 给的代码 80%错误的 |
![]() | 78 batyu 196 天前 DS 给出的答案,最好二次确认一遍。有些东西简直是现编的 |
![]() | 79 iv2ex 196 天前 @billly #73 请问哪里可以体验`Gemini2.5 pro `。我看 `https://gemini.google.com/ ` 没有这个 |
81 DinnyXu 196 天前 相同的问题,几个 AI 模型都问问,取长补短就可以了,一次对一次错代表不了什么,只不过在写代码方面,grok 我感觉还是强,可能是因为马斯克他们编程能力更出色? 但是涉及到一些我们本土化的语言表达,我认为 ds 很能懂的起,比如你可以尝试让他们起一个 LOL 的搞笑的昵称,ds 绝对能给你起很多梗,但是 grok 就做不到,所以你可以分为文科和理科的区别 |
![]() | 82 vipfts 196 天前 ![]() 你的使用姿势对, ds 很差劲啊, 比 grok3 差远了, 所有问题试了上万次次都表现很差 |
![]() | 83 gaodq 196 天前 确实是这样的 |
85 ziyeziye 196 天前 只能说编程方面 ds 的确差点,还有就是上下文长度差了很多(编程问题和幻觉严重都受到这个影响),还有就是不支持多模态,其他的你想说有别的 ai 比 ds 强那是不可能的,其他都逻辑推理比 ds 差了不是一点 |
86 wryyyyyyyyyyyy 196 天前 @DIO 这个 qwen QWQ 在哪里可以用?自己没条件部署。 |
![]() | 88 AlexHsu 196 天前 ds 的价值是 671b 开源 今年从过年回来到现在 我都部了两套了 但是都是 32b 的 去年政企还没啥需求呢 能力上 别说 grok 了 比 gpt4o1 和 claude3.7 也没得比啊 |
![]() | 89 neptuno 196 天前 ds 的意义是训练成本低+开源。我一直不觉得它推理很强。 |
92 jurassic2long 196 天前 个人经验,DeepSeek 分析问题时最好看它的思维链,然后人工得出答案,经常遇到思维链分析思路非常正确,结论确实错误的情况。grok 用的少,也遇到过几次类似问题,grok 的思维链似乎比其他的要长不少,阅读思维链要花更多时间 |
![]() | 93 Moierby 196 天前 楼主先了解一下通用模型和推理模型的区别 写代码应该用推理模型,deepseek 不擅长做这个 |
![]() | 94 dbaazz 196 天前 @iv2ex #79 https://aistudio.google.com 这里可以使用谷歌全部的模型 |
95 johnhuangemc2 196 天前 @lovedebug 我也觉得让 deepseek r1 根据自己的需求写出提示词质量特别高 |
96 coolcoffee 196 天前 DS 给我的感觉就和 Google Gemini 差不多,跑分没输过,但是。。。 不过它们还是有价值的,能把 openai 和 anthropic 牙膏管给挤爆。 |
![]() | 97 liangzaiyi 196 天前 日常编程方面用 deepseek 和 grok 比较多,各有胜负。GPT 已经弃用了。deepseek 除了慢点和有时候服务崩,思考分析我觉得是最好的,常恨服务不给力。 |
![]() | 98 Wonz 196 天前 那就对了 |
![]() | 99 Promtheus 196 天前 deepseek 好像是老外吹起来的。。 |
![]() | 100 ssb4 196 天前 ![]() deepseek 用户有几个拿他写代码?码农不要拿自己太当回事了 |