录制视频结束,自动生成字幕,目前 APP 有这样的技术吗? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
iOS 开发实用技术导航
NSHipster 中文版
http://nshipster.cn/
cocos2d 开源 2D 游戏引擎
http://www.cocos2d-iphone.org/
CocoaPods
http://cocoapods.org/
Google Analytics for Mobile 统计解决方案
http://code.google.com/mobile/analytics/
WWDC
https://developer.apple.com/wwdc/
Design Guides and Resources
https://developer.apple.com/design/
Transcripts of WWDC sessions
http://asciiwwdc.com
Cocoa with Love
http://cocoawithlove.com/
Cocoa Dev Central
http://cocoadevcentral.com/
NSHipster
http://nshipster.com/
Style Guides
Google Objective-C Style Guide
NYTimes Objective-C Style Guide
Useful Tools and Services
Charles Web Debugging Proxy
Smore
lllllin
V2EX    iDev

录制视频结束,自动生成字幕,目前 APP 有这样的技术吗?

  •  
  •   lllllin 2019-12-19 08:58:47 +08:00 21150 次点击
    这是一个创建于 2192 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前的需求是录制视频结束就自动生成字幕……想知道市面上现在有这样的 APP 么,

    49 条回复    2020-05-13 23:16:29 +08:00
    ozuikai
        1
    ozuikai  
       2019-12-19 09:06:05 +08:00 via iPhone   2
    试下快影 可以一键生成字幕
    fredcc
        2
    fredcc  
       2019-12-19 09:09:58 +08:00
    谷歌 pixel4 recorder 支持英文实时字幕
    aainidexiho
        3
    aainidexiho  
       2019-12-19 09:12:02 +08:00
    学习眼
    lllllin
        4
    lllllin  
    OP
       2019-12-19 09:15:44 +08:00
    @fredcc 是让在 APP 开发一个这样的功能
    lllllin
        5
    lllllin  
    OP
       2019-12-19 09:16:48 +08:00
    @ozuikai 看了一下和里面的字幕识别差不多
    lllllin
        6
    lllllin  
    OP
       2019-12-19 09:17:53 +08:00
    @aainidexiho App Store 没搜到这个 APP 啊
    easonHHH
        7
    easonHHH  
       2019-12-19 09:18:10 +08:00
    网易见外有提供 API
    li02
        8
    li02  
       2019-12-19 09:23:11 +08:00
    当然有
    hereIsChen
        9
    hereIsChen  
       2019-12-19 09:23:52 +08:00
    涉及两点:
    1.语音识别,语音转文字
    2.自动校对时间轴
    好像一些云厂商已经有相关技术,
    如腾讯云 ASR,会生成这种格式的,
    "[0:0.000,0:2.260,0] 腾讯云语音识别欢迎您。\n"
    binbinyouliiii
        10
    binbinyouliiii  
       2019-12-19 09:26:06 +08:00
    人人影视有
    airmour
        11
    airmour  
       2019-12-19 09:26:56 +08:00
    抖音有这个功能 自动生成字幕
    lllllin
        12
    lllllin  
    OP
       201912-19 09:27:35 +08:00
    @hereIsChen 对,就是这个意思,要转文字+时间轴 1 楼发的快影上确实有这样的功能
    miniwade514
        13
    miniwade514  
       2019-12-19 09:29:22 +08:00 via iPhone
    @lllllin 估计是“插眼,学习”的意思
    jason19659
        14
    jason19659  
       2019-12-19 09:30:28 +08:00
    没有。。。怎么的得先上传语音然后语音识别。百度倒是有实时语音识别。。https://ai.baidu.com/tech/speech/realtime_asr 但是也不开放给普通员工啊
    tsening
        15
    tsening  
       2019-12-19 09:31:59 +08:00
    抖音可以 2333
    Moyudawang
        16
    Moyudawang  
       2019-12-19 09:32:37 +08:00
    小米相机可以在录制时实时生成字幕
    lllllin
        17
    lllllin  
    OP
       2019-12-19 09:35:27 +08:00
    @jason19659
    @tsening 让我照着抖音做我也做不出来啊 233333333
    lllllin
        18
    lllllin  
    OP
       2019-12-19 09:40:08 +08:00
    @tsening
    @jason19659 刚才把抖音断网了试了一下,需要联网使用,算法是云计算在服务器的………………
    qzhai
        19
    qzhai  
       2019-12-19 09:41:15 +08:00
    锤子科技, 坚果 pro3 的大爆炸。 炸音频。。。
    460881773
        20
    460881773  
       2019-12-19 09:53:17 +08:00
    有的吧。
    upbenoit
        21
    upbenoit  
       2019-12-19 10:08:33 +08:00
    是 srt 字幕还是直接内嵌视频里的吖?内嵌视频的美颜相机就可以了。。
    mclxly
        22
    mclxly  
       2019-12-19 10:15:07 +08:00
    我实现过非实时的:把视频的语音分离,通过语音文件生成字幕文件,然后合并到视频。
    yisheyuanzhang
        23
    yisheyuanzhang  
       2019-12-19 11:12:59 +08:00   1
    前几天看到论坛上有人发过,Golang 的,t/627277
    看样子是截取为音频文件,调阿里录音文件识别接口
    SteveLee
        24
    SteveLee  
       2019-12-19 11:15:58 +08:00
    powerpoint 可以在演示的时候拾取麦克风的声音实时生成字幕
    haozes
        25
    haozes  
       2019-12-19 11:19:51 +08:00   1
    传到 youtube 上,youtube 会自动生成字幕。然后把字幕文件下载下来,还有时间轴,这是免费的
    https://zhuwei.me/y2b/
    ansonsiva
        26
    ansonsiva  
       2019-12-19 11:20:50 +08:00
    科大讯飞有,但是收费的
    录制完成后还可以搜索文字来定位视频位置
    sizhengping
        27
    sizhengping  
       2019-12-19 11:31:18 +08:00
    @haozes YouTube 支持中文吗?
    lllllin
        28
    lllllin  
    OP
       2019-12-19 12:03:39 +08:00
    @mclxly
    @ansonsiva 字幕文件生成了有时间轴的位置吗……
    mclxly
        29
    mclxly  
       2019-12-19 12:21:22 +08:00
    @lllllin 有时间轴位置,中文需要考虑换行处理,识别准确率一般,总的来说还是省了很多事。

    具体可以试用我的 wx 小程序(小视频神器)智能字幕功能。
    jielong
        30
    jielong  
       2019-12-19 12:24:08 +08:00
    longbye0
        31
    longbye0  
       2019-12-19 12:42:59 +08:00
    很多。
    我老东家的 Wide 短视频就有。
    poporange630
        32
    poporange630  
       2019-12-19 12:52:05 +08:00 via iPhone
    剪映就有 是抖音旗下的剪辑软件
    IGJacklove
        33
    IGJacklove  
       2019-12-19 12:53:08 +08:00
    YouTube 就有吧,可以根据声音生成字幕。YouTube 可以直播自动生成字幕
    x66
        34
    x66  
       2019-12-19 12:58:55 +08:00
    前几天 Redmi K30 发布会上卢伟冰专门讲了这个功能,MIUI 应该都支持的
    benjix
        35
    benjix  
       2019-12-19 13:04:35 +08:00 via iPhone
    Python 有个 autosub 库
    flyhaozi
        36
    flyhaozi  
       2019-12-19 13:20:11 +08:00
    利用微软 Azure 的 Video Indexer 是可以实现这种功能的,不知道市面上有没有
    https://vi.microsoft.com/zh-hans/#speechToTextHeading
    wxl1380610
        37
    wxl1380610  
       2019-12-19 13:33:41 +08:00
    公司项目需要 , 试过 google 和 ibm watson , google 还是比较强大 语言多 , 价钱低 , 中文不知道那个好些 ,中文觉得还是国内的服务商应该会更好些 .

    https://cloud.google.com/speech-to-text/
    https://www.ibm.com/watson
    muzuiget
        38
    muzuiget  
       2019-12-19 14:55:28 +08:00
    按准确率还是用大厂的云服务比较好,但是价格就是感人。
    GoTop
        39
    GoTop  
       2019-12-19 15:39:38 +08:00
    @hereIsChen #9

    可是是收费的
    xomix
        40
    xomix  
       2019-12-19 15:45:44 +08:00
    @wxl1380610 #37 咦 ibm 这个王八蛋当年卖了 ViaVoice 给微软,现在又搞出来一套新的?小娜跟着干爹一起气鼓鼓想打人
    pnongrata
        41
    pnongrata  
       2019-12-19 15:56:22 +08:00
    苹果自己的 Clips 就支持一边录视频一边自动生成字幕……

    并且各种语言都可以………………
    lllllin
        42
    lllllin  
    OP
       2019-12-19 16:56:17 +08:00
    @pnongrata 但是自己怎么出来这样的东西呢
    mlboy
        43
    mlboy  
       2019-12-19 18:57:24 +08:00 via iPhone
    Youtube 了解一下
    wxl1380610
        44
    wxl1380610  
       2019-12-19 19:05:29 +08:00
    @xomix 哈哈 记得几年前 有一次公司开年会 搞了台 小娜 调戏 还挺惊艳的
    PixelMage
        45
    PixelMage  
       2019-12-19 19:27:47 +08:00
    autosub 了解一下 gayhub 开源
    ViggoSite
        46
    ViggoSite  
       2019-12-20 09:15:36 +08:00
    你可以试试我的开源项目,是一个能识别视频语音自动生成字幕 SRT 文件的开源 Windows 软件,基于 Golang。

    https://github.com/wxbool/video-srt-windows
    hereIsChen
        47
    hereIsChen  
       2019-12-20 09:24:00 +08:00
    @GoTop 如果是纯个人使用,可以考虑上面他们说的方法,但是如果是要做产品,商业化,那么还是要用收费的;关键就是要货比三家,看看哪家识别度高性价比高
    kimiszc
        48
    kimiszc  
       2019-12-20 10:43:11 +08:00
    Apple 自己有一个 app,不知道是否符合你的需求。
    https://apps.apple.com/cn/app/%E5%8F%AF%E7%AB%8B%E6%8B%8D/id1212699939
    lbj96347
        49
    lbj96347  
       2020-05-13 23:16:29 +08:00
    https://githb.com/lbj96347/auto-caption-mac/

    迟些移植一个 iOS / iPadOS 上的版本,视频使用教程:
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3838 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 05:30 PVG 13:30 LAX 21:30 JFK 00:30
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86