
CPU:英特尔( Intel ) i9-10900X 酷睿十核 盒装 CPU 处理器 GPU:技嘉(GIGABYTE)GeForce RTX 2080Ti GAMING OC 1665-1650MHz 14000MHz 352bit GDDR6 11G 电竞游戏显卡 X2 内存条:金士顿(Kingston) DDR4 2666 16B 台式机内存条 X4 水冷:九州风神( DEEPCOOL ) 水元素 240RGB CPU 水冷散热器(泄压冷排 /RGB 风扇 /支持 I9 2066 、AM4/静音) 固态:三星( SAMSUNG ) 1TB SSD 固态硬盘 M.2 接口(NVMe 协议) 970 PRO ( MZ-V7P1T0BW ) 电源:美商海盗船 (USCORSAIR) AX1600i 1600W 电脑电源(全模组数字 /80PLUS 钛金认证 /十年质保) 硬盘:希捷(Seagate)6TB 256MB 5400RPM 台式机机械硬盘 SATA 接口 希捷酷鱼 BarraCuda 系列(ST6000DM003) 主板:华硕( ASUS ) PRIME X299-A 主板 ( Intel X299/LGA 2066 ) 机箱:美商海盗船 (USCORSAIR) 780T 黑色 全塔机箱(侧透 /支持 E-ATX 主板 /3 速风量调节 /4 组水冷位 /35CM 显卡)
1 murmur 2020-06-18 08:55:38 +08:00 看着真难受,水冷上个 360 的,这么牛逼的 u 散热器就不要吝啬了 |
2 malusama 2020-06-18 08:59:06 +08:00 老哥排一下格式啊, 要不然上图片 |
3 kop1989 2020-06-18 08:59:20 +08:00 这个硬盘是个叠瓦盘吧 |
4 cowarder OP CPU:英特尔( Intel ) i9-10900X 酷睿十核 盒装 CPU 处理器 GPU:技嘉(GIGABYTE)GeForce RTX 2080Ti GAMING OC 1665-1650MHz 14000MHz 352bit GDDR6 11G 电竞游戏显卡 X2 内存条:金士顿(Kingston) DDR4 2666 16GB 台式机内存条 X4 水冷:九州风神( DEEPCOOL )水元素 360RGB CPU 水冷散热器(一体式水冷 /静音 /3 个 RGB 风扇 /稳压 I9/标配硅脂) 固态:三星( SAMSUNG ) 1TB SSD 固态硬盘 M.2 接口(NVMe 协议) 970 PRO ( MZ-V7P1T0BW ) 电源:美商海盗船 (USCORSAIR) AX1600i 1600W 电脑电源(全模组数字 /80PLUS 钛金认证 /十年质保) 硬盘:希捷(Seagate)6TB 256MB 5400RPM 台式机机械硬盘 SATA 接口 希捷酷鱼 BarraCuda 系列(ST6000DM003) 主板:华硕( ASUS ) PRIME X299-A 主板 ( Intel X299/LGA 2066 ) 机箱:美商海盗船 (USCORSAIR) 780T 黑色 全塔机箱(侧透 /支持 E-ATX 主板 /3 速风量调节 /4 组水冷位 /35CM 显卡) |
9 cowarder OP 懂得老哥们,这一套配起来能不能用,有没有明显的两个配件不匹配的问题呢,就怕买回来组装不起来哈哈 |
10 Porphet 2020-06-18 09:13:46 +08:00 自用的服务器?还是实验室里的? CPU 可以不用上这么好的,GPU 还是换显存大一些的吧,我觉得至少 24g 以上 |
11 niubee1 2020-06-18 09:14:28 +08:00 会不会最终大部分时间还是拿来游戏了? |
14 OP 老哥们,给个意见,这个能用着不,没啥硬性问题我今天就要买了,正好搞活动经费够 |
15 murmur 2020-06-18 09:18:59 +08:00 @Porphet testla v100,这卡一张四万到六万块,主要优化在(据说稳定性)、并行性能、功耗 如果不爆显存的话 在 FP 32 单精度训练上,Titan RTX 平均: 比 RTX 2080Ti 快 8%; 比 GTX 1080Ti 快 46.8%; 比 Titan Xp 快 31.4%; 比 Titan V 快 4%; 比 Tesla V100 ( 32 GB )慢 13.7%。 这是网上评测结果,所以说 2080ti 性价比是最高 |
16 Merlini 2020-06-18 09:20:42 +08:00 via Android 不建议在本地跑大模型。原因有几个: 1. 2080ti 本身也不是很强力,训练需要的时间很长。再比如说你要 fine tuning 一个 Bert,显存就要 12G,要求太高了。 2. 在训练的时候,gpu 负载很高,如果你要顺便干别的事情,不方便或者卡。 3. 现在 colab 的免费 gpu 都 k80 了,还是可以用一用的,弄个鼠标连点器,然后设置一下训练保存这些。 4. cloud computing 是未来。 |
18 Porphet 2020-06-18 09:27:00 +08:00 @murmur 嗯,参数上看是最优选择。但是实际用起来,11g 的显存经常会爆的,尤其是用预训练模型( NLP 任务)。 任务都跑不起来,何谈其他。 用 pytorch 可以将一个模型分布在两个 gpu 上,但是写起来限制也挺多的。比如,需要人为把模型分开,强行分成两个模型。这样码代码的工作量就会很大,时间都浪费在改代码上,我现在的情况就是这样,很难受 我现在用 TitanV*2,但是肯定不够用,下一步实验室要换 RTX8000,哈哈 |
20 Merlini 2020-06-18 09:28:16 +08:00 via Android 当然也不是说不能用,不过如果是比较专业的,以发论文打比赛为主的,还是不建议。 楼主说是多人用的,那么就会遇到其他人在跑模型的时候,另外一些人就得等了。况且很多时候不是跑一次就行,得调参吧。 还有一个情况是,现在的模型都被大公司带跑偏了,都是大的不行。比如说 NLP 领域最近新出的 GPT3,参数就有 175B 。如果以后这种模型越来越多的话,硬件会跟不上。 你说可以有模型压缩加速这些方法呀。这个领域目前还在研究阶段,做的比较成熟的就是 mobilenet,distillbert 那些。没有到大规模应用的时候。 |
21 madeye 2020-06-18 09:28:48 +08:00 不如做个等等党,新卡九月份就来了哦,BF16 TF32 这些新特性对于训练爆显存问题有奇效。 https://devblogs.nvidia.com/nvidia-ampere-architecture-in-depth/ |
22 czwstc 2020-06-18 09:29:04 +08:00 via iPhone |
25 cowarder OP 老哥们的意见都很好哈,感谢感谢,但是情况是,实验室就给了这么点钱,当然都知道更好的卡性能更好呢,但是手头紧不是,现实情况它不允许哈哈 |
26 hugedata 2020-06-18 09:51:44 +08:00 如果配好之后用不了(性能不够跑不起来)或者用着不爽(没有办法并行多个模型训练任务),能不能五千包邮卖给我?/doge |
27 nxforce 2020-06-18 10:10:09 +08:00 via Android 我想问一下,这一套下来要多少钱 |
28 murmur 2020-06-18 10:13:51 +08:00 @joyhub2140 三万块钱 |
29 murmur 2020-06-18 10:18:01 +08:00 2080ti 今天打特价 8500 一张 板 u 套装加起来 5500 这些就两万二了 其余的看着奢华也不是极品 三万怎么也下来了 如果是龙神 360 水冷 太阳神机箱 那档次就不一样了 |
30 FaceBug 2020-06-18 10:42:13 +08:00 买这么贵的机箱,还说实验室没有钱,哈哈哈 |
31 coderluan 2020-06-18 11:03:28 +08:00 二手 RTX6000/8000 楼主有兴趣吗 去年十月自己创业买的 因为疫情熬不住了 打算 6 折出了 可以开票. |
32 gadsavesme 2020-06-18 11:40:03 +08:00 能不能跑深度学习我不清楚,但这个配置去打游戏是真的很爽(狗头) |
33 xuehaihang 2020-06-18 11:57:27 +08:00 2080ti 支持半精度 fp16 训练,显存占用远小于 fp32,自用性价比挺高了,实验室用,这卡数,这内存都不太给力呀 |
34 ShallowAi 2020-06-18 11:58:45 +08:00 via Android 这么高预算就不要用金士顿内存了 换英睿达普条 16Gx4 硬盘 6TB 应该上企业级的希捷银河 酷鱼是叠瓦盘 如果 CPU 没有强制要求考虑一下 AMD |
35 niubee1 2020-06-18 12:17:08 +08:00 @
|