有没有什么思路可以训练一个纠正口语发音的 AI - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yoiteshaw
V2EX    发音

有没有什么思路可以训练一个纠正口语发音的 AI

  •  
  •   yoiteshaw 2024-07-04 23:11:39 +08:00 1156 次点击
    这是一个创建于 463 天前的主题,其中的信息可能已经有所发展或是发生改变。
    想一改几十年的哑巴英语,希望境外出行的时候避免尴尬,与老外开会的时候避免结巴。
    ---------------------------------------------------------------

    市面上其实已经有很多这样可以练习的成品 AI 了。
    目前尝试了一个 Pronounce 的网页,谷歌就能搜到,每天有在练习它的任务,是用 AI 纠正你的发音的,但是比较坑的点在于它能纠正的点太少,我明明感一篇短文起码十几个错误,它只给我点出来四五个,再更完全的口语分析需要交费,包月是每个月 8 刀好像。

    在手机上也试过一个练习口语的叫 TalkAI ,试了一下确实蛮 nb 的,但是需要收费,而且问题和前面一样,免费版的体验有限,收费也比较贵,不过是买断式。

    ----------------------------------------------------------------
    于是萌生了一个念头,即我猜测这些软件的原理是“录音的分词”+“语库发音的比对”。
    那么目前条件如下:

    1.我可以随意找到一篇英语短文练习(互联网上到处都是)
    2.我可以轻易将这篇英文转为标准的口语语音(无论是翻译 app 还是 chatGPT 帮我朗读、或者有专业的读文章的软件)

    那么我需要一个算法:
    1.将我的录音以及标准发音的音频进行分词。
    2.在 1 的基础上,假设分词的数量是一致的,那么只需要匹配上我发音的单词的置信度,告知我置信度即可告知我的发音是否标准。


    我对这块并不是很熟悉,但是愿意稍微花点时间去了解一下,请问大家伙是否有合适的思路或者现有的开源项目可以推荐呢?如果最后实现了,我也可以反馈社区分享给大家。
    3 条回复    2025-09-03 13:43:38 +08:00
    bailitusu
        1
    bailitusu  
       38 天前
    一年过去了,OP 的口语咋样了,能不能分享一下学习方式?(我是通过 TalkAI 搜索到这个帖子的)
    yoiteshaw
        2
    yoiteshaw  
    OP
       37 天前 via iPhone
    @bailitusu 我有发了一个新帖,我自己开发了一套脚本来练习。大概练习了六级听力材料半年多,我自认为有进步,效果还可以。

    为什么练习了半年多呢,因为我后面出国了几次,发现比起口语,听力更重要,你口语无论说成怎么样,白人黑人都听得懂……我就把重心放听力上先了。
    bailitusu
        3
    bailitusu  
       37 天前
    @yoiteshaw 谢谢分享,我听力还可以,但开口说的时候老卡壳,没办法把自己的想法很流畅的表达出来
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2484 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 15:31 PVG 23:31 LAX 08:31 JFK 11:31
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86