国内大模型与 chatgpt - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
AlfredNing
V2EX    问与答

国内大模型与 chatgpt

  • &bsp;
  •   AlfredNing 182 天前 1995 次点击
    这是一个创建于 182 天前的主题,其中的信息可能已经有所发展或是发生改变。

    小白关于国内大模型有几个疑问

    1. 国内这么多的模型:通义系列,豆包、deepseek 等 与 chatgpt 有什么样的区别。(目前看来 chatgp 已经有收费版本,国内大部分免费)
    2. 如果要用 AI 做一些事情,用国外的还是国内比较好。
    3. 想知道为什么模型不同的底层原理是什么,除了训练的数据量之外。(希望能够用通俗易懂的话来解释)
    9 条回复    2025-06-30 10:03:03 +08:00
    donaldturinglee
        1
    donaldturinglee  
       182 天前 via Android
    小白可以不考虑第三点,前两点取决你的目的是要做什么
    neteroster
        2
    neteroster  
       182 天前 via Android   1
    1. 你的指代太宽泛以至于无法给出切题的答案。请注意 ChatGPT 是产品不是模型。模型的能力是一个复杂的事情,各自有各自擅长的地方,例如 ChatGPT o3 擅长多轮搜索,Claude 擅长编码 agent ,Gemini 擅长长文本召回和多模态等等。

    2. 目前总体来说御三家( OpenAI, Anthropic, Google )还是比国内的模型领先一大截的。不过还是那个问题,在会用且了解模型能力的情况下差距才能体现。

    3. 虽然御三家基本上都对自己的模型架构守口如瓶,但是几乎可以肯定的是他们都基于一种非常基础且重要的组件 Transformer (由 Google 在 2017 年的论文 Attention is All You Need 提出)。在此基础上模型的其他组成会有一些差别,例如是 dense 模型或是 MoE 模型(目前推测御三家基本都在用 MoE, 其中 Gemini 在技术报告中直接说了,Deepseek V3 / R1 也是 MoE ),其他地方也会有些许差别。还有就是训练,除了训练数据量还有数据筛选清洗合成管线等等,以及各种训练参数,后训练(包括重强化学习用于训练推理模型)方案等等,这些也多属于独家秘方,就算是 Deepseek 这种开放团队在这方面公开的信息也是少之又少,更不用说商业模型了。
    ferock
        3
    ferock  
    PRO
       182 天前 via Android
    没太大区别,qwen3 已经很聪明了,只是国内没有对软件付费的习惯,搞付费了活不下去
    HENQIGUAI
        4
    HENQIGUAI  
       182 天前
    这个问题三言两语回答不清楚,我的总结是都用,多用就知道效果如何了,然后想深入原理的话可能要专门学一下了。
    xinyu391
        5
    xinyu391  
       182 天前
    国内还在竞争,肯定会提供免费的产品。
    flynaj
        6
    flynaj  
       182 天前 via Android
    这些 ai 都是基于 Google 2017 年发表论文《 Attention is All You Need 》,没有多大区别,你就把 ai 当做一个人,国内的中文知识要多一些,看你要做什么来选择。
    Kenshiro
        7
    Kenshiro  
       182 天前 via iPhone
    国内的宣传性高于实用性,自己体验下来就是不行,特别是吹的天花乱坠的 DS 和豆包,动不动就做很荒谬的自圆其说和恶意推定
    sosme
        8
    sosme  
       182 天前
    对大部分普通用户来说,差距很小
    hafuhafu
        9
    hafuhafu  
       182 天前
    2. 看你的问题的领域。有些领域差距挺大的。正常问答、问代码可能差距还没这么大。比如我前阵子闲着无聊就给自己库存的 ACG 壁纸自动 tag 写回文件方便分类,因为出来的 tag 都是英文或者罗马音,不可避免要批量翻译成中文。我试了一下主流 LLM ,差距还是蛮明显的。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5819 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 35ms UTC 06:16 PVG 14:16 LAX 22:16 JFK 01:16
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86