想问问大家有没有搭建本地的 LLM,我对应用场景挺困惑的 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
vtea
V2EX    Local LLM

想问问大家有没有搭建本地的 LLM,我对应用场景挺困惑的

  •  
  •   vtea 9 天前 1252 次点击

    现在大语言模型挺火,我平时用的都是在线的 chatgpt 、deepseek 之类。

    最近看到 AMD AIMAX 395 什么的,我在想是否自己组一个,本地搭建一个蒸馏模型。

    但除了隐私数据安全相关问题,像我这样普通人,也想不出本地应用场景的优势。

    9 条回复    2025-12-30 12:49:14 +08:00
    donaldturinglee
        1
    donaldturinglee  
       9 天前   1
    本地跑小模型玩一玩,学习一下原理,真要在生产环境用肯定是组卡或者买 API 。
    crocoBaby
        2
    crocoBaby  
       9 天前 via iPhone   1
    本地部署只玩到推理,但是 ai 含金量高的技术是预训练,所以本地部署使用场景有点鸡肋
    vtea
        3
    vtea  
    OP
       9 天前
    @donaldturinglee 也是,平时使用,我看买会员那种也还行
    @crocoBaby 预训练对我来说太难了,我只想过用 llm 来推荐买基金的时间点
    xiaket
        4
    xiaket  
       9 天前   1
    ^用正常模型来给一个程式化的判据, 而不是每次需要依赖不那么可靠的本地模型来预测
    volvo007
        5
    volvo007  
       8 天前 via iPhone   1
    我们这行有很多测试标准,所以准备给公司搭一个知识库用。但设备是专门的 4 卡 A100 ,还有一台 8 卡 4090 的准备放点别的小玩意。就算推理也是需要一点算力和显存才可用
    crocoBaby
        6
    crocoBaby  
       8 天前   1
    @vtea 那线上免费的对话已经足够你使用了,你需要的只是调教 prompt
    wnzhyee
        7
    wnzhyee  
       8 天前   1
    参数量为王,再怎么蒸馏,家用 pc 的那点性能能搭起来的 LLM 和闭源那些主流模型比差距太大了,不是一个世界的
    Daybyedream
        8
    Daybyedream  
       8 天前   1
    自己弄个 然后弄个 dify
    coefu
        9
    coefu  
       7 天前   1
    本地起码要 2*nvidia dgx spark 起步,或者一个 mac studio ultra m4 512G ,不然都是玩具。
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2456 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 15:50 PVG 23:50 LAX 07:50 JFK 10:50
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86