![]() | 1 surbomfla 37 天前 写代码 不要使用 Gemini ,pom.xml 文件开头 <?xml ,gemini cli 生成了 <xml ,测试其他 ds claude glm4.5 模型没出过这样的低级问题 |
![]() | 2 liulicaixiao 37 天前 |
![]() | 3 ma46 37 天前 推理过程正确,结果错误 |
![]() | 4 omega3 37 天前 我的 gemini 两次都回答 true ,你可能遇到降智了 |
![]() | 5 xomix 37 天前 AI 本质上是内容生成,现在就算是看起来再有逻辑,它也不会直接通过逻辑判断,所以这种测试在当下没有什么必要。对于训练者无非是针对这些东西做一些内容训练。 |
![]() | 6 thinkever 37 天前 gemini 代码能力确实欠缺一些,建议 claude 或 deepseek-r1 |
![]() | 7 2en 37 天前 |
![]() | 8 htfcuddles 37 天前 我用 API 测试者正确的,有没有可能你 IP 太脏被降智了? |
![]() | 9 Curtion 37 天前 |
![]() | 10 imsuxp 37 天前 |
11 bbao 37 天前 Gemini 我不信任他,刚开始我用一个开源项目进行测试,分析,只有它的输出驴唇不对马嘴,就在那编; chatgpt 都是没问题的。 |
12 Jasonqiao 37 天前 我也感觉大概率是被降智,最近我的 gemini 也频繁遇到这样的问题,对话中我使用一些完全不生僻的简写或名词,它能直接开始臆想瞎编,哪怕调用一下搜索也不至于生成完全驴唇不对马嘴的答案。我这用的 IP 纯净度应该还好啊,有重置或修复的办法么? |
13 livin2 37 天前 降智这种成本控制操作确实难顶,哪怕直接严风控封 IP 呢 |
14 street000 37 天前 via Android 感觉 App 的 Gemini 是被降智了,AI Studio 里的 Flash Lite 都能答对。 |
![]() | 15 qxmqh 37 天前 Gemini 只会道歉和一个劲的客气,跟 tm 日本人似的。很傻瓜。 |
![]() | 16 snow0 37 天前 |
![]() | 17 nealHuang OP @liulicaixiao 强如 Claude 也降智 |
![]() | 18 nealHuang OP @htfcuddles 有可能哈,不过我是 gemini 的年度 pro 教育白嫖版,居然都降智!真是大胆 |
19 eroneko 37 天前 2.5 Pro 降智很严重,怀念 03-25 |
![]() | 20 pweng286 37 天前 |
![]() | 21 westfall 37 天前 今天薅了个 Gemini 教育版,免费 12 个月,第一次对话就给我干懵了,它居然倾向于欺骗我。它声称自己能听懂音频,我上传了个外企工作相关的访谈节目让它总结一下,它给我瞎编一通。 https://g.co/gemini/share/46062a841a23 |
22 kekxv 37 天前 via iPhone gemini-cli 的 2.5 Pro 贼强 |
23 yulon 37 天前 可能数据有污染,Qwen 正确,GLM 居然错了,而且它自己都说 0 小于正数了,结果却是 false 。 |
![]() | 24 rrfeng 37 天前 Gemini flash 回答正确 |
![]() | 25 Kairossaster 37 天前 via Android gemini2.5pro 和 chatgpt 输出 true 。claude sonnet4.1 和 grok3 false |
26 charles0 36 天前 三个不同渠道的 gemini-2.5-pro 都给了 true 的正确答案,你肯定遇到降智了 |
27 yulon 36 天前 我好像知道某些 AI 的逻辑了: 因为二进制的存储方式,把「正数」和「无符号数/非负数」划等号了,0 被 AI 当成了「正数」,此时 0 自己就是「最小的正数」,当然不能小于「最小的正数」。 并且在某些推理过程中,虽然能得出 Double.MIN_VALUE 是「大于 0 的正数」,但是在后续推理中,可能出于节省 token ,变成了「正数」,而「正数」又被误解为「全体正数」,被当成「正数」的 0 ,自然也不能小于「全体正数」。 |
28 cat1879 36 天前 gemini 2.5pro False PPLX ture claude false |
![]() | 29 since2021 36 天前 我第二次开了 deep thought 回答对了,第一次不对 |
30 zpxshl 36 天前 gemini2.5 输出 true ,我是用 poe 中转的 e |