M2 128GB 的 Mac Studio 与 NVDIA A100 相比如何? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
coinbase
V2EX    硬件

M2 128GB 的 Mac Studio 与 NVDIA A100 相比如何?

  •  
  •   coinbase 2024-02-24 20:27:28 +08:00 3147 次点击
    这是一个创建于 600 天前的主题,其中的信息可能已经有所发展或是发生改变。

    在人工智能使用方面,尤其是 LLMs.

    Mac Studio 128GB 仍然比 A100 80GB 便宜得多。

    14 条回复    2024-02-26 12:04:55 +08:00
    coinbase
        1
    coinbase  
    OP
       2024-02-24 20:28:59 +08:00
    等 M3 的 Mac Studio 出来,感觉比 A100 性价比舒服很多
    june4
        2
    june4  
       2024-02-24 21:01:25 +08:00
    比的是内存大小?那确实 m2 便宜,不过小米更便宜
    66450146
        3
    66450146  
       2024-02-24 21:19:55 +08:00 via iPhone
    @june4 比的是显存大小
    kaichen
        4
    kaichen  
    PRO
       2024-02-24 21:31:07 +08:00   1
    那你可以对比 96G 的价格,从推理来说,能效方面 apple silicon 比较高,并且买回来就能用,买个 A100 还要组个主机

    但是推理速度会被吊打,基本上差一个量级

    - https://towardsdatascience.com/how-fast-is-mlx-a-comprehensive-benchmark-on-8-apple-silicon-chips-and-4-cuda-gpus-378a0ae356a0
    - https://owehrens.com/whisper-nvidia-rtx-4090-vs-m1pro-with-mlx/
    kaichen
        5
    kaichen  
    PRO
       2024-02-24 21:34:17 +08:00   1
    在 reddit 的 local llama 上,比较推崇的是买两块 3090 组 nvlink ,这样有 48G ,可以刚刚好跑个 70b 的 q5 量化版
    stimw
        6
    stimw  
       2024-02-24 22:37:12 +08:00
    这只是对于一部分 LLM ,可能 apple silicon 显得非常有性价比。

    但是对于 SD ,SVD 等任务来说就不是这么一回事了。可用性并不高。
    awah
        7
    awah  
       2024-02-24 22:41:51 +08:00 via iPhone
    推理速度太不行,只是能用
    litguy
        8
    litguy  
       2024-02-25 10:45:04 +08:00
    感觉性能是 奥拓 vs 奥迪
    coinbase
        9
    coinbase  
    OP
       2024-02-25 10:58:22 +08:00
    @kaichen @stimw @luguhu @litguy

    在运行 70b 的 llama2 的时候,M3 Max 128G 要比 4090 更快:

    具体请看这个测试视频:

    在运行 7b 和 13b 的模型的时候,M3 Max 稍微慢点,但是也不是说被 4090 吊打
    coinbase
        10
    coinbase  
    OP
       2024-02-25 10:59:01 +08:00
    @coinbase #9 说错,应该是打不过 A100 ,不好意思
    stimw
        11
    stimw  
       2024-02-25 15:49:28 +08:00
    @coinbase #9 你别拉到最后看结果啊。4090 慢的原因是超显存了,结果就是需要过 pcie 过 cpu 过内存。
    事实上 70b 的 llama 完全可以用两块 3090 组 nvlink ,你看还慢不慢?

    买 apple silicon 的结果就是,除了围绕 llama.cpp 做文章,干其他事的可用性对比 cuda 约等于 0 。
    Alias4ck
        12
    Alias4ck  
       2024-02-26 11:17:13 +08:00
    @stimw 也不完全是 llama.cpp, apple 去年也有出自己的 ml 框架(mlx( https://github.com/ml-explore/mlx) ) 用来转 coreml

    有很多应用的例子 : https://github.com/ml-explore/mlx-examples
    比如你可以在 apple silicon 上跑大语言模型的微调等
    xz410236056
        13
    xz410236056  
       2024-02-26 11:36:25 +08:00
    @Alias4ck #12 MLX 这东西跟用 pytorch 调用 MPS 训练,然后将成果使用 coreml tool 转成 coreml 模型什么区别呢。
    stimw
        14
    stimw  
       2024-02-26 12:04:55 +08:00 via Android
    @Alias4ck https://github.com/TristanBilot/mlx-benchmark

    看见过,但是这个成绩我觉得可用性很差
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5462 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 06:03 PVG 14:03 LAX 23:03 JFK 02:03
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86