我有很多 32 核的 cpu 机器,想要跨这些机器使用所有的 cpu 算力进行推理。
这个该怎么做啊?
是不是部署 k8s 集群就可以,还是有更简单的办法?
还是说用分布式的 spark 等计算框架?但是具体该怎么搞呢。没头绪
这个该怎么做啊?
是不是部署 k8s 集群就可以,还是有更简单的办法?
还是说用分布式的 spark 等计算框架?但是具体该怎么搞呢。没头绪

1 murmur Nov 16, 2023 你做科学计算么,有的科学计算是 cpu 运算+大内存,不过也不是用框架,直接买现成的软件,比如电磁学的 feko |
4 israinbow Nov 17, 2023 TorchServe 或者黄核弹的 TensorRT? 我们做边缘计算的还有用 ONNX 的, 挑一个吧 |
5 max1911 Nov 17, 2023 op 可以试试 ggml 库重新,基于 ggml 上的项目 llama.cpp ,可以实现用 C++运行语言模型 |
6 max1911 Nov 17, 2023 |
7 max1911 Nov 17, 2023 |
8 t133 Nov 20, 2023 via iPhone 大矩阵的乘法除非你有 infiniband 并行效率惨不忍睹 |