cpu 密集型 c++程序,性能瓶颈在 blas 库上,现在用的 openblas,
cpu 型号:e5-2620 v4
求大佬指点,
cpu 型号:e5-2620 v4
求大佬指点,

1 GM Jun 10, 2019 理论上会快一些,毕竟是官方御用编译器。 |
2 lzzr Jun 10, 2019 mkl 的 blas 可能性能比较好 |
3 FrankHB Jun 10, 2019 没类似经验,但 icc 对 blas 这样的用例风评应该还好。 已经推测出热点的程序,要证实就直接重新测啊。 编译一遍很费事么…… |
4 FrankHB Jun 10, 2019 ……如果是还没有部署工具链需要采购授权或者已经有售后,建议直接咨询厂商。 (这玩意儿应该还是有对一些平台配置有针对优化的。) |
5 weifengzi2009 Jun 10, 2019 BLAS 用 MKL 或者 BLIS 吧。 如果瓶颈只是在 BLAS 库上,那你换 icc 可能没那么大差距,反正 gcc 也可以链接 mkl。但是 icc 一般来说性能确实比 gcc 好,我编译超算的应用能用 icc 我就不用 gcc。。。 |
6 secondwtq Jun 10, 2019 你可以去看一眼 optimization report ... |
7 bsidb Jun 10, 2019 via Android mkl 的性能比 openblas 好很多,这个比较关键。 |
8 owt5008137 Jun 11, 2019 via Android 测一下呗,不就知道了? |