V2EX carmark 的所有回复 第 1 页 / 共 22 页
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX    carmark    全部回复第 1 页 / 共 22 页
回复总数  439
1  2  3  4  5  6  7  8  9  10 ... 22  
123 天前
回复了 ryan4yin 创建的主题 Kubernetes KubeCon China 2025 见闻
@ryan4yin 所以总结下呢? All in AI 的感觉?
SeaweedFS 主要还是图片或其他非经常修改的对象,如果经常更改,可能并不如 minio 功能完善。
245 天前
回复了 zhuwd 创建的主题 VIDIA NVLink 对显卡集群的影响有多大?
8 台还是 8 张,节点内可以走 nvlink 或者 pcie ,节点间如果要低延时可以走 IB 或者 RoCE 。一般而言推理并不需要高带宽,但是需要低延迟的产品。所以如果是 8 台机器最好上 IB 或者 RoCE ,这个比以太网好太多,如果是单机八卡那么其实上 nvlink 意义不大,重点还是要用正经的推理引擎,ollama 的目标是为了能兼容多种硬件。
可以跟别人卷 mlsys
277 天前
回复了 walkingDoge 创建的主题 程序员 GPU 虚拟化有哪些应用场景?
开发机,小模型( CV )推理。
@allegory BOSS 搜一下呢?这个主要是搞 RoCE 拥塞控制,各种监控,各种识别,然后与 nccl 协同。

当然还有比如新华三这种做 RoCE 协议开发的。
建议找个实习搞 RDMA ,这个可能方向性上面更好,AI 强依赖这个。

无论从需求到场景都会更多。
@ruanimal

Base 湾区 $130k-170k/yr, 0.5%-1.5% equity
Base 国内面议
326 天前
回复了 dreamdragon 创建的主题 程序员 ceph 生产环境搭建和配置推荐
用 ceph 之前先看看自己的场景,一般 rbd>rgw>fs ,块设备的话问题应该比较小,文件系统风险最大。

同时要考虑好部署服务对象,以及具体要求,如果是小文件很多的场景,那么 fs 压力会非常大,而且经常容易 OOM 。

所以存储不能解决所有场景的问题,最简单的办法就是简化问题,放到垂直领域,用最简单的功能,减少复杂功能的使用。

如果要细节,那就太多了,我也不是专业的,只是刚毕业的时候搞了两年存储。
- ebpf
- 高性能网络,RDMA ,RoCE
2024-09-18 09:43:57 +08:00
回复了 wuzeiyicixing 创建的主题 NAS 请教下 10G 内网 IO 有瓶颈吗?
10G 网卡一般指的是 10Gbps ,对应而言就是 1.25GB/s 。
NVMe 的一般顺序读写速度,大概率应该会大于网络速度,具体可以实测下 FIO 。

RDMA 这个基本上可以不用考虑的,万兆没必要。

这里面的变量在于你的内存以及存储的文件数量,如果你随机读取,而存储文件数量巨大,那么寻址将会带来额外的磁盘开销,内存大小决定了你能缓存多少文件 metadata 。
2024-08-08 11:03:11 +08:00
回复了 duck2 创建的主题 分享发现 本地化运动圈
羽毛球在北京最大的难题是订不到场地,如果临时定场地,周末基本上没有。
2024-08-01 20:38:48 +08:00
回复了 Sfilata 创建的主题 职场话题 想知道各位大佬的职业路线
Solaris 内核->Kubernetes->Kubeflow->LLM 系统
具体的方案可以参考这里: https://zhuanlan.zhihu.com/p/398369404

参考方案就是阿里的 cGPU ,腾讯的 qGPU 。

主要实现的思路就是 ioctl 层面的拦截,干预调度和显存管理。
2024-05-29 21:19:15 +08:00
回复了 liang723 创建的主题 职场话题 现在有没有 ai 平台的架构师方向?需要精通啥?
@liang723 规模大了的话,一般大厂规模会更大。不过现在小厂也是随便有百卡(盲猜)。
2024-05-29 17:53:37 +08:00
回复了 liang723 创建的主题 职场话题 现在有没有 ai 平台的架构师方向?需要精通啥?
说下我的感受,做 AI 平台+系统 接近 8 年:
1. K8s 现在针对 AI 平台,技术点主要包括:调度器( Gang Scheduler ),Training-Operator 这种;这里面可做的点比如:调度器性能优化,调度器调度优化解决碎片问题,解决高低优先级问题,节点内亲和性,节点间 RDMA 网络亲和性; Operator 里面结合调度,如何做容错等;

2. K8s 结合存储系统,类似 Fluid 或者其他存储方案,如何针对性提升,或者针对存储解决 AI 训练或推理场景的问题,比如训练的低延迟,推理的高吞吐;是否可以搞个缓存系统,缓存如何优化,Dataloader 如何搞;

3. K8s 结合网络,这里主要是 SRIOV 相关的技术,基于 sriov-Operator ,以及网络上 multus 就差不多;

4. K8s 结合 GPU ,GPU Device plugin ,GPU Operator 以及其他,基于 nv 的卡都具备了,GPU 可以搞搞虚拟化,容器 GPU 虚拟化,虚拟机咋接,怎么调度这些;

5. AI 平台流程化,比如熟悉 AI 算法的开发流程,调试流程,上线流程,CV 和 LLM 的特点是啥,数据集管理这些;

6. 需要了解 AI 任务分布式特点,如何建立,如何容错,如何与 K8s 结合,这部分就是 Training Operator 的内容,需要知道。

7. 进一步就是了解 AI 算法本身,比如大模型计算过程,参数量啥的,还有推理优化、预训练优化等等;
2024-04-12 16:41:44 +08:00
回复了 betnevs 创建的主题 程序员 (求助)如何用 AI 大模型做社区内容运营?
类似脉脉的思路,辅助生成答案?
2024-02-13 09:28:57 +08:00
回复了 xfrgux 创建的主题 游戏 2024 年了,云游戏体验还是不行
国内的话可以试试 haixingcloud.com ,专为游戏配置的高主频 CPU ,RTX 3090,4090 显卡。
2023-10-15 10:39:19 +08:00
回复了 lufeng666 创建的主题 奇思妙想 [需求征集] 最想要个什么样的应用?
@lufeng666 是的,所以才是少见,但是感觉是刚需,即便把这个做成一个服务,都会有人付费的。
1  2  3  4  5  6  7  8  9  10 ... 22  
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2671 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 37ms UTC 13:31 PVG 21:31 LAX 06:31 JFK 09:31
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86