V2EX hbdh5
 hbdh5 最近的时间轴更新
hbdh5

hbdh5

V2EX 第 562222 号会员,加入于 2021-11-18 15:46:15 +08:00
hbdh5 最近回复了
答案就是没啥用,再高配上个 4090 顶天了。内存配到 200 多 g 顶天了。但是你想本地部署个最新的开源模型最新的 moe 别说放显存,内存都装不进去,估计还得丑陋的放硬盘 swap 。而自己有个啥 idea 想训练个模型验证想法更是别想了。也就打打游戏能行。
284 天前
回复了 rudy1224 创建的主题 OpenAI 怎样用掉 OpenAI API 账户中的余额
把 key 给我,3 天后用不完算我输
284 天前
回复了 resu 创建的主题 OpenAI 请教定制 AI LLM 系统
你要本地部署?那采购个几个 8 卡 A800 节点的钱应该没问题吧?你说的定制如果是 prompt 那问题不大,你要是指的是定制模型那请参考最近 deepseek 训练成本 278.8 万 H800 GPU 小时,另外能有 deepseek 实力和微调经验的人工费我都没给你算。

我真的觉得有时候用户不知道自己想要什么。要这要那的,丝毫不顾自己那点需求其实用不到也用不起。
286 天前
回复了 houshuu 创建的主题 Local LLM DeepSeek V3
@neteroster 是的,论文主要的亮点就是训练部分,不得不说还得是 MoE ,要是 dense 模型参数太大的话一张卡放不下数据交换的妈都不认识,根本没地应用这么多优化。只能送钱给老黄。
@mumbler 可题主问的是笔记本跑,那我就默认是个人用了。医疗数据应该是有业务用途的怎么也得买个 8 卡集群吧?
287 天前
回复了 houshuu 创建的主题 Local LLM DeepSeek V3
没人关注训练部分吗?看看原始论文,推理部分的优化似乎来自蒸馏自家的推理模型,auxilary loss 动态调度负载 + DualPipe 优化 pipeline bubbles + 根据通信做混合精度优化, 计算与通信的瓶颈的优化做到极致了。以至于训练成本只有 500 多万刀,和 o 家和 g 家比算是用乞丐的成本达成了至少也是不相上下的结果。要我说,closedai 不做人干脆把 gpu 匀给 deepseek ,可惜匀不得。
推荐就是老老实实的调 api ,别想本地跑啥模型,新发布的 deepseek v3 看了吧,这玩意主流的笔记本就是量化到 1bit 都加载不进内存。
技术没啥门槛,RAG+AI Agent+Promt ,国内主要是底模不行,要有个 sonnet 那样强大的底模才行。国内那些大公司还是少弄些开源刷榜的模型把,弄个强大闭源的底模比天天刷那些 ai 榜单强一万倍。
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     985 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 17ms UTC 22:52 PVG 06:52 LAX 15:52 JFK 18:52
Do have faith in what you're doing.
ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86