YouTube 这类视频里的语音是 AI 么? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
拼车信息请发到 /go/cosub 节点。

如果没有发送到 /go/cosub,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
Livid
61.5D
458.41D
V2EX    YouTube

YouTube 这类视频里的语音是 AI 么?

  •  
  •   Livid
    PRO
    2023-02-25 12:12:48 +08:00 7325 次点击
    这是一个创建于 958 天前的主题,其中的信息可能已经有所发展或是发生改变。
    62 条回复    2023-03-06 09:01:05 +08:00
    KKLeon
        1
    KKLeon  
       2023-02-25 12:20:40 +08:00 via Android
    这个听起来不像 ai ,看了这个 up 主主页视频以及评论区,应该是 up 主自己解说的。印象比较深的 ai 解说,一般上来就是:男人怎么怎么怎么……
    botao1
        2
    botao1  
       2023-02-25 12:24:40 +08:00
    这个可能不是,但很多娱乐评论或者影视快剪类型都是 AI 直接读脚本,就那么 3 ,4 个语音库,偶尔遇到多音字会露馅
    kaishi123
        3
    kaishi123  
       2023-02-25 12:25:34 +08:00
    Ai 无疑,正常人不会把 雪藏 cang 念成雪 zang
    cmdOptionKana
        4
    cmdOptionKana  
       2023-02-25 12:25:58 +08:00
    口音不像 AI ,但如果专门拿一个人的口音来训练,AI 可以做到和这个人的念稿一模一样,主要是他的文案太书面语了,无法体现真人的优势。
    XiaoBaiYa
        5
    XiaoBaiYa  
       2023-02-25 12:26:31 +08:00
    很难判定,但节奏特征很像,
    1 、每句话中间停顿的时间基本一样
    2 、每个字使用的时间基本差不多
    kaishi123
        6
    kaishi123  
       2023-02-25 12:27:39 +08:00
    又听了一遍,应该是我听错了
    不过这个声音挺熟悉,会不会是把 ai 的声音调整了一下放上去?
    xuangoer666
        7
    xuangoer666  
       2023-02-25 12:28:07 +08:00 via Android
    @kaishi123 #3 我就会。。。
    KKLeon
        8
    KKLeon  
       2023-02-25 12:33:50 +08:00 via Android   2
    @kaishi123 你是不是听错了,我开大声音听了几遍,人家发音就是雪 cang 啊
    cmdOptionKana
        9
    cmdOptionKana  
       2023-02-25 12:34:50 +08:00   1
    一般优秀的讲解会加入大量口语,情绪波动也比较大,如果只是平平地念稿,那就算是真人,也只能得到 “不比 AI 好” 的评价。
    bjzhush
        10
    bjzhush  
       2023-02-25 12:38:29 +08:00
    这个是不是 AI 确实已经很难判定了
    但是我搭车举例一个同样很难判定的。
    之前看到过某做电话营销方案的技术分享,他们把非常多的话术做了以句为单位的录音,比如“您好”,“谢谢”,“您可以了解一下我们的产品”,“我们稍后联系您”
    然后通过程序打电话,判断用户的状态和需求,然后播放录音回复,这玩意也是半人半 AI ,不是心思缜密的大部分人听不出来对面其实不是真人,和这个难以判断是否 AI 的播音有异曲同工之妙。
    我接到推销电话,有这种怀疑的时候,一般会直接问,你姓什么?程序 99%都会卡住,正常人会回复
    KKLeon
        11
    KKLeon  
       2023-02-25 12:39:55 +08:00 via Android
    @cmdOptionKana 确实,这个 up 主的解说词写的一般,看了评论区以及跨越长周期的解说对比,应该是真人,但属于全程平平念稿。油管有个越哥说电影稿子解说都不错,就是标题经常用那种标准的标题党,也是为了吸引力吧
    country
        12
    country  
       2023-02-25 12:48:00 +08:00
    歪个楼,这个视频的仙剑配乐叫啥来着?谢谢
    asktao
        13
    asktao  
       2023-02-25 12:58:54 +08:00
    在 B 站也有账号 120 万粉丝。如果早期是原音这个大概率是 AI 。
    omcourseecust
        14
    omcourseecust  
       2023-02-25 12:59:40 +08:00
    @kaishi123 它读的是 cang 啊
    bobryjosin
        15
    bobryjosin  
       2023-02-25 13:02:11 +08:00
    读的没有情感像是 ai ,在 0:29 流氓这个词一般读法都是[liú máng],而视频中读的感觉像是[liú mǎng],氓这个字只有 méng 和 máng ,这两种读音。
    Jamari
        16
    Jamari  
       2023-02-25 13:11:43 +08:00 via iPhone
    怎么了,你的平台不让 ai 就算了,人家的平台你还管得着?
    pista
        17
    pista  
       2023-02-25 13:12:59 +08:00 via Android
    这不叫 AI 吧,顶多语音转文字
    opei3v1867r0zNrq
        18
    opei3v1867r0zNrq  
       2023-02-25 14:10:02 +08:00
    @bobryjosin 就是这个我感觉才是真人,AI 虽然朗读没感情不过不会音不准。
    sNullp
        19
    sNullp  
       2023-02-25 14:13:27 +08:00
    @pista 楼主的意思应该是 TTS
    sNullp
        20
    sNullp  
       2023-02-25 14:14:07 +08:00
    @HY3 应该是文案打错了,比如达成了流莽
    mogita
        21
    mogita  
       2023-02-25 14:33:19 +08:00   1
    @country 新仙剑《群山》
    Ericcccccccc
        22
    Ericcccccccc  
       2023-02-25 14:34:32 +08:00
    很像是 AI 配音的.
    mogita
        23
    mogita  
       2023-02-25 14:38:44 +08:00
    普通话 93 分用户表示,如果是 TTS ,厂商大概率会做成普通话一甲水平(不讨论地方话版本)。但视频的咬字听起来有太多不好的习惯,以及朗诵的中重格式各种蹩脚,所以猜测这不是 TTS ,最多是个很非主流的 TTS ,大概率是真人朗读。看楼下老师傅怎么说。
    KevZhi
        24
    KevZhi  
       2023-02-25 14:47:03 +08:00
    缺少非常多真人朗诵时的情绪变化特征,怀疑大概率是 TTS 。重音标注到位是可以达到这个效果的。
    SZP1206
        25
    SZP1206  
       2023-02-25 16:21:10 +08:00
    听起来是真人
    sillydaddy
        27
    sillydaddy  
       2023-02-25 16:47:32 +08:00
    有一个小细节,0:50~0:52 ,
    字幕是「接受外国电影的熏陶」,但读时把「外国」读成了「国外」。
    sincus
        28
    sincus  
       2023-02-25 16:51:08 +08:00
    我从头看到尾了,应该不是 ai.
    cbais7890
        29
    cbais7890  
       2023-02-25 17:14:26 +08:00
    基本可以断定是 AI, 通过每集片尾的几个固定语句 "我们下_期再见" 的固定停顿和基本完全一致的速度和语调, 如果不是 AI 的话很难做到每集都完全一致.
    fackVL
        30
    fackVL  
       2023-02-25 17:31:18 +08:00 via iPhone
    真人,然后调了语速所以听起来有点怪
    chihiro2014
        31
    chihiro2014  
       2023-02-25 17:55:18 +08:00   1
    让我想起了大壮,小美,翠花
    iFrey
        32
    iFrey  
    PRO
       2023-02-25 17:57:50 +08:00
    听口音,这个像是真人,不是 AI
    AOK123
        33
    AOK123  
       2023-02-25 18:11:27 +08:00
    真人,念名字“崔明亮”的时候语气语调不像 AI
    Wobuguan
        34
    Wobuguan  
       2023-02-25 18:19:35 +08:00 via Android
    我认为是 AI ,听久了断句节奏基本一样。
    Myprajna
        35
    Myprajna  
       2023-02-25 18:24:52 +08:00
    只要没在别的地方没听过就是真人。
    6c9fd
        36
    6c9fd  
       2023-02-25 18:38:02 +08:00
    格外疏远几个字让我觉得应该不是 AI
    ashong
        37
    ashong  
       2023-02-25 18:40:13 +08:00
    不像, 感觉目前视频网站 AI 配音就那几个
    jwenjian
        38
    jwenjian  
       2023-02-25 18:44:50 +08:00
    "这裤子工人穿着干不成活", “裤子”和“工人”中间没有停顿, 我听起来 95%是 AI
    Dragonphy
        39
    Dragonphy  
       2023-02-25 18:45:00 +08:00
    lks 的那期声音 AI 视频已经让我怀疑人声了,我已经无法分辨了
    UnderAbove
        40
    UnderAbove  
       2023-02-25 19:11:58 +08:00 via iPhone
    念到陈凯歌的名字时,「陈」字有较为明显的哨音。不应该是 AI 。
    idealhs
        41
    idealhs  
       2023-02-25 19:16:26 +08:00
    没听过类似的 AI 语音,确实没法判断
    想听不是 AI 语音的,建议看 B 站 up 恐怖地带来恐怖
    freepoint
        42
    freepoint  
       2023-02-25 19:53:05 +08:00
    听着有点像,语调基本一致。鉴定完毕 over
    Tlvncks
        43
    Tlvncks  
       2023-02-25 19:55:42 +08:00   1
    @country #12 里面有多段配乐,其中一段应该是仙剑奇侠传二里的《蝶恋》
    LaurelHarmon
        44
    LaurelHarmon  
       2023-02-25 20:06:40 +08:00
    完了,已经快分不出来了。
    ji39
        45
    ji39  
       2023-02-25 20:11:02 +08:00
    没人写稿,直接 ai 接管内容输出语言,厉害了
    Herry001
        46
    Herry001  
       2023-02-25 20:11:50 +08:00
    找到个最早的视频,要么是换人了要么显而易见…… https://www.bilibili.com/video/BV1Dt411e72p/
    Tlvncks
        47
    Tlvncks  
       2023-02-25 20:42:43 +08:00   1
    @country #12 仙剑奇侠传四《寂难永劫 - 玄霄主题曲》-骆集益
    cmdOptionKana
        48
    cmdOptionKana  
       2023-02-25 21:35:58 +08:00
    @idealhs 哈哈哈哈,我也爱看这个 “痛!太痛了!”
    MC
        49
    MC  
       2023-02-25 22:32:30 +08:00
    有可能是用 veed 做的,他们的 tts 库效果很好
    https://www.veed.io/
    MC
        50
    MC  
       2023-02-25 23:06:59 +08:00
    但是我用 veed 的 男性声音全部听了一遍,并没有影片里的这个声音,可能是真人?
    hoky
        51
    hoky  
       2023-02-25 23:11:28 +08:00
    @MC 这个支持中文?
    vesx484
        52
    vesx484  
       2023-02-25 23:48:11 +08:00 via iPhone
    是真人
    nnegier
        53
    nnegier  
       2023-02-26 03:57:36 +08:00 via Android
    好电影,好解说
    DreamWeaver2016
        54
    DreamWeaver2016  
       2023-02-26 07:22:20 +08:00 via iPhone
    应该是真人吧
    lurui45
        55
    lurui45  
       2023-02-26 10:33:06 +08:00
    这个电影当时我没看得下去,看了这个解说真的拍得好,70 ,80 那代青年何尝不曾有梦想,到头来大部分人还是要蜷缩在小乡镇里过一辈子。
    fengleiyidao
        56
    fengleiyidao  
       2023-02-26 10:55:34 +08:00
    @MC
    通过调各种参数,甚至后期处理,是可以做出不一样的声音的。
    camus
        57
    camus  
       2023-02-26 11:03:51 +08:00
    @kaishi123 只从错别字而言,你高估了有些读稿“机器”的文化水平了……
    a90120411
        58
    a90120411  
       2023-02-26 20:00:34 +08:00
    感觉是真人,解说的还挺好的。
    MC
        59
    MC  
       2023-02-26 23:19:38 +08:00
    @fengleiyidao 对的,语气之类都能调,不过 veed 我仔细看了下,其实是微软的那套 tts 。
    @hoky 是的,本质上是微软 tts ,支持多种语言,不光是中文
    sisteryu100
        60
    sisteryu100  
       2023-02-26 23:57:10 +08:00 via iPhone   1
    XXX 分看影基本上都是,除非是一些特老牌的博主。
    wenzaiquan199
        61
    wenzaiquan199  
       2023-02-28 00:36:00 +08:00
    @kaishi123 #3
    你是不是听错了,我听了几遍都是 cang
    nijux
        62
    nijux  
       2023-03-06 09:01:05 +08:00
    关于     帮助文档     自助推广系统     博客     API     FAQ     olana     2838 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 14:25 PVG 22:25 LAX 07:25 JFK 10:25
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86