AI 服务器配置报价 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要在回答技术问题时复制粘贴 AI 生成的内容
dododada
V2EX    程序员

AI 服务器配置报价

  •  
  •   dododada 2024-04-25 08:55:52 +08:00 4077 次点击
    这是一个创建于 601 天前的主题,其中的信息可能已经有所发展或是发生改变。

    接上文,原先计划采购华为腾做适配,但是调研了一圈发现采购排产要一个月,模型适配时间无法预估,所以两条腿走路,继续用 4090

    浪潮给了个配置报价

    浪潮 NF5280M6
    cpu intel xeon 4316 * 2 内存 32g ecc* 8 硬盘 1.92T SATA SSD * 1 + 4T SATA2 GPU rtx 4090 * 2 电源 2700W2
    报价 83000

    有兄弟知道这个 4316 ,能不能发挥 4090 的最大性能

    硬盘不大,因为我们做视频分析,处理完就删掉了,所以对存储要求不高

    20 条回复    2024-04-25 11:59:42 +08:00
    defunct9
        1
    defunct9  
       2024-04-25 08:58:07 +08:00
    当然能
    falsepromise
        2
    falsepromise  
       2024-04-25 08:59:16 +08:00
    8 卡的 4090 现在一般都是搭配 Intel Xeon 铂金 8352V ,2.1GHz/36 核/72 线程/195W
    也见过搭配 Intel 8462Y+ 4th Generation Intel XeonScalableProcessors 2.8Ghz/32 核/64 线程/300w 这个的
    dododada
        3
    dododada  
    OP
       2024-04-25 09:14:52 +08:00
    @falsepromise 我们用的两张卡,单台要控制在 10W 以内
    ktyang
        4
    ktyang  
       2024-04-25 09:17:17 +08:00
    看你们的网络吃不吃 cpu 了。。。我们有个模型吃 cpu ,4090 使用率一直上不去。。。
    ktyang
        5
    ktyang  
       2024-04-25 09:18:51 +08:00
    @dododada autodl 有台 10w 出头的 4 卡机器,我当时想买,被公司采购卡住了。。。
    lizhisty
        6
    lizhisty  
       2024-04-25 09:23:47 +08:00
    @ktyang 为啥采购卡住了
    leidayu
        7
    leidayu  
       2024-04-25 09:39:30 +08:00
    整机全新的?有点贵
    ktyang
        8
    ktyang  
       2024-04-25 09:43:44 +08:00
    @lizhisty 公司采购不按我们提供的线索找供应商,只会找库里的供应商问配置,找几家供应商询价以后与初始预算相差较大。。。流程就打回了。。。
    dododada
        9
    dododada  
    OP
       2024-04-25 09:45:54 +08:00
    @ktyang 再吃 cpu ,应该也比我们原先的那个 6133 要强,那个 U 也不知道怎么买的,导致 4090 利用率很低
    dododada
        10
    dododada  
    OP
       2024-04-25 09:46:19 +08:00
    @leidayu 全新的机器
    dododada
        11
    dododada  
    OP
       2024-04-25 09:51:46 +08:00
    @defunct9 我主要担心这个 4316 的 U 拖后腿
    winglight2016
        12
    winglight2016  
       2024-04-25 10:03:25 +08:00
    4090 显存够吗?视频处理需要的显存比图片高多了
    tap91624
        13
    tap91624  
       2024-04-25 10:03:46 +08:00
    需要双卡吗,4090 没 nvlink 挺伤的
    feirisu
        14
    feirisu  
       2024-04-25 10:07:43 +08:00
    这俩 4090 能跑 70B 的 chat 模型吗
    ZedRover
        15
    ZedRover  
       2024-04-25 10:12:42 +08:00
    我公司用的 5218R + 3 x A5000 ,感觉这个 CPU 太弱了,比 4316 差 0.25 左右,平时开 DDP 训练 num_workers 开到最大,训练速度上去之后 cpu 占用在 80% 左右,显卡没到瓶颈 cpu 已经不能再并行了。之前用 8380 有时候都感觉不够用,感觉最起码也要 8275 吧,并且 8275 性价比这么高 aws 之前很多都是用 8275
    dododada
        16
    dododada  
    OP
       2024-04-25 10:29:55 +08:00
    @ZedRover 这台机器不做训练,只做推理分析,chat 模型暂时不考虑。Platinum 3 代有些贵。

    上面说的显存够不够的问题,目前一天处理 600-700 小时的视频。客户希望处理 7000 小时,这个到时候堆机器吧
    lm930129
        17
    lm930129  
       2024-04-25 11:33:36 +08:00
    @dododada #9 6133 是当年阿里还是腾讯的定制 U ,量大。二手很便宜。如果你们是走采购的,买 6133 大概率是被坑了,这个 U 是给云服务器用的
    unknowsll
        18
    unknowsll  
       2024-04-25 11:54:35 +08:00
    OP 如果对配置有疑问可以多找几个厂家报一下,目前硬件市场属于买方市场,dell H3C 安擎 宝德 硅基 那么一大堆呢,每家都出一份,你就知道市场行情了。云计算行业相关从业,目前项目上面用到的都是 G5 6348(2.6GHz/28 核/42MB/235W)CPU 模块(CTO&BTO)
    FlashEcho
        19
    FlashEcho  
       2024-04-25 11:58:08 +08:00
    纯属把钱花到刀把上了,双卡 4090 要什么机架式服务器,还配那么大内存,居然要要 83000 ,你随便买个工作站放在脚边都能用双卡 4090

    可以参考一下这个报价,10w 就有 4 卡 4090 了
    FlashEcho
        20
    FlashEcho  
       2024-04-25 11:59:42 +08:00   1
    关于     帮助文档     自助广系统     博客     API     FAQ     Solana     4523 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 24ms UTC 04:00 PVG 12:00 LAX 20:00 JFK 23:00
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86