一个简单的本地语音识别服务 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
jianchang512
V2EX    分享创造

一个简单的本地语音识别服务

  •  
  •   jianchang512
    jianchang512 2024-01-01 23:26:55 +08:00 4304 次点击
    这是一个创建于 647 天前的主题,其中的信息可能已经有所发展或是发生改变。
    基于 openai-whipser 开源模型和 flask ,搭建的本地离线运行的语音识别服务,主要自用用于取代百度语音识别的。

    GitHub: https://github.com/jianchang512/stt

    这是一个离线运行的本地语音识别转文字工具,基于 openai-whipser 开源模型,可将视频/音频中的人类声音识别并转为文字,可输出 json 格式、srt 字幕带时间戳格式、纯文字格式。可用于自行部署后替代 openai 的语音识别接口或百度语音识别等,准确率基本等同 openai 官方 api 接口。


    10 条回复    2024-11-28 02:00:58 +08:00
    lloovve
        1
    lloovve  
       2024-01-02 00:56:11 +08:00 via iPhone
    识别效果如何?能在 linux 下部署么
    kkstart
        2
    kkstart  
       2024-01-02 01:18:55 +08:00
    赞,效果如何?
    tqyq88
        3
    tqyq88  
       2024-01-02 08:57:40 +08:00   1
    https://github.com/SYSTRAN/faster-whisper 这个性能吊打 openai 原生的
    eatgrass
        4
    eatgrass  
       2024-01-02 11:29:27 +08:00
    https://huggingface.co/spaces/Xenova/whisper-web
    直接浏览器里运行,0 部署
    JNian
        5
    JNian  
       2024-01-02 15:06:59 +08:00
    请问作者有没有考虑增加 diarization 功能
    buyno1
        6
    buyno1  
       2024-03-22 23:02:36 +08:00
    对 windows 版本有什么要求?电脑配图什么要求
    buyno1
        7
    buyno1  
       2024-03-23 11:34:34 +08:00
    @tqyq88 colab 有没有平替的 用来你说这个部署
    buyno1
        8
    buyno1  
       2024-03-23 13:04:37 +08:00
    @eatgrass 用 19 秒的 mp3 试了 报错
    chopin1998519
        9
    chopin1998519  
       2024-08-15 17:07:41 +08:00
    WizardLeo
        10
    WizardLeo  
       316 天前
    @eatgrass 有点强,这个真好用
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     864 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 21:13 PVG 05:13 LAX 14:13 JFK 17:13
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86