关于算力单位 TOPS、FLOPS 和 MACS 的一些疑问 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
mzotw2babm
V2EX span class="chevron">   NVIDIA

关于算力单位 TOPS、FLOPS 和 MACS 的一些疑问

  •  
  •   mzotw2babm 2022-05-17 10:50:47 +08:00 3898 次点击
    这是一个创建于 1242 天前的主题,其中的信息可能已经有所发展或是发生改变。

    各位大佬,

    应公司要求,最近在做 Nvidia 的芯片研究,研究过程中发现对算力大小的描述出现了多种不同的单位。

    TOPS:每秒可做 1T 次操作 TFLOPS:每秒可做 1T 次浮点操作 GMACS:每秒可做 1G 次定点乘累积操作

    我看到描述算力大小的时候,有时候用 TOPS ,有时候用 TFLOPS ,我想知道这两者之间没有一个确定的换算关系吗?

    再就是想问一下,浮点运算和定点乘累积运算分别的使用场景。我看到图像处理这一块好像浮点运算比较多,但音频处理定点乘累积运算比较多?

    5 条回复    2022-05-19 10:59:10 +08:00
    thinkershare
        1
    thinkershare  
       2022-05-17 10:57:40 +08:00   1
    没有直接的换算关系, 否则就不会出现这么多单位了. 主要看你干什么, 因为不同场景下评估一个芯片的算力使用同一个单位是无法准确对比其真实性能的. 不同类型的任务有时候用的操作类型有时候相差很多, 甚至完全不相干. 在做卷积神经网络训练的时候, 我们做报告都使用 GMACs, 因为主要的就是乘积累加运算.
    mzotw2babm
        2
    mzotw2babm  
    OP
       2022-05-17 11:07:37 +08:00
    @thinkershare #1 谢谢大佬,追问一下,卷积神经网络不是对 FP16 FP32 或者 INT8 的运算能力要求比较高吗?

    另外,能否解释一下,这个 TOPS 中所谓的多少次操作,都是指什么操作?我看我们芯片选型的时候最后只参考了 TOPS 一个参数,是不是这个参数在某种程度上有一定广泛适用性,可以代表整体的性能?
    thinkershare
        3
    thinkershare  
       2022-05-17 11:21:41 +08:00   1
    我只是一个小透明, 主要是 FP16(也比较少),FP32(密集), uint8 很少(transforms 最初需要), 然后就需要大量的累乘和加法了, 因为不同类型的运算耗时也是不同的, 所有只能综合考虑.一般 TOPS 应该是只能做 8 位的定点数运算, 浮点运算需要模拟, 一般 GPU 我感觉都是使用 FLOPS, TOPS 用在于 FPGA, 很少看到混合使用. 另外芯片中不同位长, 不同类型的运算所需要的时间都不相同, 不在同一个标准, 有时候很难定量的去比较实际差异, 你可以 google 搜索一下相关的研究论文.
    mzotw2babm
        4
    mzotw2babm  
    OP
       2022-05-17 11:31:33 +08:00
    @thinkershare #3 谢谢大佬。
    mzotw2babm
        5
    mzotw2babm  
    OP
       2022-05-19 10:59:10 +08:00   1
    @thinkershare #3 大佬,我在网上找到一篇文章,感觉有些用处,跟你分享一下
    http://www.360doc.com/content/21/0419/01/30375878_972997803.shtml
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1029 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 30ms UTC 18:37 PVG 02:37 LAX 11:37 JFK 14:37
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86