如果两个模型互相蒸馏,最终是什么结果? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
ysy950803
V2EX    OpenAI

如果两个模型互相蒸馏,最终是什么结果?

  •  1
     
  •   ysy950803 315 天前 2531 次点击
    这是一个创建于 315 天前的主题,其中的信息可能已经有所发展或是发生改变。

    最近有人说 DeepSeek 是蒸馏了 ChatGPT 的,以此来降低成本,有没有大模型领域的佬来解释下,业界内这种做法算常规吗?

    然后我突发奇想,如果两个模型互相蒸馏,反复进行,最终它们会变成一个模型吗?比如说回答的内容会变成一模一样的。从技术上如何解释?

    9 条回复    2025-02-11 08:28:29 +08:00
    Muniesa
        1
    Muniesa  
       315 天前
    这个叫 deep mutual learning
    my101du
        2
    my101du  
       315 天前   8
    这一片红花绿草,在太阳的照耀下,光影投射到地面,多么美丽啊!

    光影照着花草,多美!

    草!美!
    ysy950803
        3
    ysy950803  
    OP
       315 天前
    @my101du 笑死,有点形象了。
    GaGaGood
        4
    GaGaGood  
       315 天前
    @my101du 笑死
    YogaHale
        5
    YogaHale  
       315 天前 via iPhone
    参考近亲交配
    hefish
        6
    hefish  
       315 天前
    直接蒸干了。。。
    renmu
        7
    renmu  
       315 天前 via Android
    ai 模型的语料不就是抄来抄去,再加上已经部分语料已经被 ai 污染了
    Izual_Yang
        8
    Izual_Yang  
       314 天前
    你就类比图片转码。高分辨率高质量往低转,肯定损失信息,有损编码更加损失。低分辨率低质量往高转,信息量摆在那里不可能凭空生成,虽然有可能训练模型从同类图片去推算,但也只是推算的,就好比 AI 模型也会产生幻觉
    fang2hou
        9
    fang2hou  
       309 天前 via iPhone   1
    模型的结构是可以做成不同大小,不同结构的,所以在不同项目上的表现也大概率有差异。训练时本身的随机性也会导致不同初始状态的网络产生差异,那么相互学习就能够从其余网络中把这些优秀的特性汇集过来。蒸馏不是抄作业答案而是把目标模型当作老师学习,逐渐让自己能够达到老师水平的感觉。是可以用算法设计把不如自己的部分无视掉的,相互学习相当于好几个学生互相切磋琢磨的过程,理论上是能提高的,大概 5 年前这个概念也是相当火爆
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1010 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 27ms UTC 18:33 PVG 02:33 LAX 10:33 JFK 13:33
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86