
1 wxd21020 OP 没人么 |
2 ellipsecheung 2024 年 7 月 27 日 多大规模的,什么显卡,要监控哪些数据 |
3 gesse 2024 年 7 月 27 日 nvidia-smi |
4 wxd21020 OP @ellipsecheung 千卡级 A100 起步 |
5 mgrddsj 2024 年 7 月 27 日 via Android 用过某高校的 HPC ,也是好多的 GPU 服务器,是用 Grafana 搭的资源占用监控。 |
8 ellipsecheung 2024 年 7 月 29 日 @wxd21020 加个 wx 聊一下? |
9 Mi1kTea 2024 年 7 月 30 日 https://github.com/utkuozdemir/nvidia_gpu_exporter?tab=readme-ov-file nvidia exporter 获取数据+Prometheus 整合数据+grafana 展示 |