不懂就问:垂直领域小词汇量(纯数字)离线语音识别用什么技术 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
maitiantuzi
V2EX    问与答

不懂就问:垂直领域小词汇量(纯数字)离线语音识别用什么技术

  •  1
     
  •   maitiantuzi 2020-07-23 22:10:38 +08:00 1993 次点击
    这是一个创建于 1905 天前的主题,其中的信息可能已经有所发展或是发生改变。

    主要是整数和小数的识别,用什么开源框架训练,如何训练,准确率相对较高? 用过各大平台的离线识别,纯数字的识别率较低。

    8 条回复    2020-07-26 08:42:17 +08:00
    NullPoint
        1
    NullPoint  
       2020-07-23 23:31:08 +08:00 via Android
    同问文字方面的,中文书写,例如十一点三,这种,如何识别
    ooh
        2
    ooh  
       2020-07-23 23:42:03 +08:00
    离线识别估计有点难,刚刚试了试三爽录音机里面的语音转写,它有动态修正我试了下正常语速识别率 100%
    ooh
        3
    ooh  
       2020-07-23 23:56:28 +08:00
    @ooh 看了看离线识别里面的命令词好像也不适合你,查了下有个叫 https://github.com/kaldi-asr/kaldi 的项目可以看看,感觉可以满足你的需求
    gargar
        4
    gargar  
       2020-07-24 00:18:15 +08:00
    什么是“垂直领域”?
    fishCatcher
        5
    fishCatcher  
       2020-07-24 00:33:35 +08:00 via iPhone
    各大云平台的自学习模型服务可以自己训练?
    Coast
        6
    Coast  
       2020-07-24 08:49:55 +08:00 via iPhone
    在第一家公司就负责纯数字串的识别,因为是纯数字识别,语言模型可以固定,相对很小。识别准确率很高。通用的模型识别结果当然不如定制的
    maitiantuzi
        7
    maitiantuzi  
    OP
    &nbp;  2020-07-24 13:08:10 +08:00
    @Coast 请问主要用的什么框架呢
    Coast
        8
    Coast  
       2020-07-26 08:42:17 +08:00
    @maitiantuzi 基于 Kaldi 做的。不过其他的也都可以
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1176 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 26ms UTC 17:36 PVG 01:36 LAX 10:36 JFK 13:36
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86