
微软 Azure 新增 9 款逼真 AI 语音,包括中文等多种语言,合成的语音不仅有情绪,还有自然的停顿和语气变化
以下从微软博客复制出来的文本和音频链接
但我现在对这个职业的热爱还是非常的,呵呵,非常的,嗯,怎么说呢?日月可鉴的,哈哈,嗯还是希望可以把这个职业做下去或者做这个声音相关领域的工作,嗯,就是把自己的优势发挥的大一点,尽可能能用到自己擅长的东西,而不是说为了工作,为了挣钱而工作。
https://ttspublic.blob.core.windows.net/nickzhao/conversation.wav
我们需要加的是生抽、老抽、料酒、白糖还有一点点的醋、盐,然后把它翻炒均匀就可以了。接下来就是收汁的阶段了哈,我们加入适量的水淀粉翻炒到这个鸡丁上色,而且汤汁呢,稍稍已经比较浓稠,啊不会轻易的滑落。
https://nerualttswaves.blob.core.windows.net/nttssamples2024/XiaoxiaoML_recipe.wav
微软 Azure 账号注册有一定门槛,为了方便用户简单上手体验,用小程序套壳做了微软这个效果炸裂的语音合成
体验方式:
微信搜索小程序 [七彩工具箱] ,点击底部"微软语音"
或微信内点击链接 #小程序://七彩工具箱/yox3tTy2XGHkA6m
或直接扫码

1 kingofzihua 2024 年 4 月 11 日 第二个确实可以,和真人一样, 第一个就不行了,明显的断裂感, |
2 lemonTreeTop OP 文案中可以适当加一些表达情感的词,如哇、吗、啊等,效果会更好 |
3 Sezxy 2024 年 4 月 11 日 第一个前面几个字开口就听出机器人味道,每个字之间的停顿都那么均匀 |
4 AthensBird 2024 年 4 月 11 日 via Android 能不能提供 9 个声音 |
5 iOCZS 2024 年 4 月 11 日 的确很逼真,跟真人似的 |
6 lemonTreeTop OP @AthensBird 目前中文只支持了一个声音,其他的非中文语言 |
7 ColoThor 2024 年 4 月 11 日 晓晓? api 现在能用吗,https://speech.microsoft.com/portal/xxxxxxxxxxxxxxx/voicegallery 好像还是旧的 |
8 zmqking 2024 年 4 月 11 日 第二段确定是 AI 合成? |
9 lemonTreeTop OP |
10 lemonTreeTop OP @zmqking 是的,你可以用小程序自己合成下 |
11 qinfengge 2024 年 4 月 11 日 这个语句间的停顿,太真实了吧 |
12 sunziren 2024 年 4 月 11 日 哇偶,好逼真呀。哈哈。 |
13 SurgaOrange 2024 年 4 月 11 日 试了一下,完全没有第二段那个效果,明显听得出来是 AI 合成的 |
14 hanggoing 2024 年 4 月 11 日 试听了一下,很逼真啊!如果能用来听电子书就好啦 |
15 adsltsee94 2024 年 4 月 11 日 我合成出来是第一个效果。。第二个声音是哪里搞的? |
16 amon 2024 年 4 月 11 日 nice ,前阵子做过一个语音产品用的也是 xiaoxiao 。 |
17 lemonTreeTop OP 微软 Azure 的 9 款新语音包括: 美式英语 - en-US-AvaMultilingualNeural:明亮、富有感染力的女性声音,音色优美。 美式英语 - en-US-AndrewMultilingualNeural:温暖、富有感染力的男性声音,让人感觉平易近人。 美式英语 - en-US-EmmaMultilingualNeural:友善、轻快、悦耳的女性声音,适用于教育和讲解场景。 美式英语 - en-US-BrianMultilingualNeural:年轻、开朗、多才多艺的声音,非常适合各种各样的环境。 德语 - De-DE-FlorianMultilingualNeural 德语 - De-DE-SeraphinaMultilingualNeural 法语 - Fr-FR-RemyMultilingualNeural 法语 - Fr-FR-VivienneMultilingualNeural 中文 - zh-CN-XiaoxiaoMultiligualNeural |
18 ColoThor 2024 年 4 月 11 日 @lemonTreeTop #9 可以了,谢谢 |
19 roding 2024 年 4 月 11 日 如果 edge 的大声朗读能用就好了。 |
20 lemonTreeTop OP @roding 哈哈,我也想,希望微软以后可以支持 |
21 shakespark 2024 年 4 月 11 日 试了一下,晓晓多语言不 |
22 ColoThor 2024 年 4 月 11 日 有 Azure 账号的安卓用户,可以试试我写的 Demo https://github.com/Colo-Thor/AzureTextSpeech |
23 JayZXu 2024 年 4 月 11 日 |
24 atalas 2024 年 4 月 11 日 体验了以下,确实不错! 想直到现在克隆出的语音,如何进行进行部署! |
25 lemonTreeTop OP @atalas 得在微软 Azure 注册账号,有点小麻烦 |
26 lemonTreeTop OP @JayZXu 长文本合成时间有点长 |
27 hauibojek 2024 年 4 月 11 日 第一段前面不太行,后面部分效果不错,第二段基本听不出来是 ai 了。 |
28 shilyx 2024 年 4 月 11 日 我早先用过,感觉完全超过了国内的几个提供商,某度和某飞 微软的支持情绪,支持方言,支持各国语言 每月 50 万字的免费额度完全够用 更重要的是他给的 demo 真的能用,而不是编译不过或配置有问题 |
29 WilliamZuo 2024 年 4 月 11 日 效果惊人,比目前 B 站虚拟主播 AI 唱歌的那些更加自然。 |
30 6NCQWh99X46kZv6x 2024 年 4 月 11 日 当时我看到的第一反应想的是:如果拿来读 《少妇白洁》 会是什么感觉。。 |
31 Andnot 2024 年 4 月 11 日 微软有离线语音包吗? |
33 dumbass 2024 年 4 月 11 日 via iPhone 惊了,像极了 Eva 的科技生活这个测评博主的声线 |
34 click 2024 年 4 月 11 日 想用来做视频配音,Azure 怎么搞免费额度? |
35 chiu 2024 年 4 月 12 日 还能加 BGM? |
36 lemonTreeTop OP @click 注册就有了 |
![]() | 37 lemonTreeTop OP @chiu 不会 |
38 chiu 2024 年 4 月 12 日 @lemonTreeTop #37 因为我听你 post 的第二段, 好像是有 BGM 的 |
39 zhousir5071 2024 年 4 月 20 日 via iPhone op ,有没有可以单独长期使用的?可以朗读文章,书籍。目前在用讯飞有声,感觉没有微软这个自然。 |
40 lemonTreeTop OP @zhousir5071 我做的小程序目前支持了公众号文章朗读,书籍还没支持 |
41 roding 2024 年 4 月 30 日 我注册了微软 Azure 账号,语音库里面找不到这个新的 xiaoxiao 语音,选择来源 openai,一个都没有,界面显示美国中北部支持?我的资源区域是美国中北部,也不到,为什么呢。 |
42 lemonTreeTop OP @roding 晓晓多语言,地区选美国东部、西欧和东南亚的其中一个,测试东南亚延迟比较低 |
43 wyd011011daniel 2024 年 5 月 14 日 @zhousir5071 #39 安卓手机 安装 阅读 、TTS Server 。然后配置一下密钥就可以了。 |
44 zhousir5071 2024 年 5 月 14 日 via iPhone @wyd011011daniel 我用的是苹果手机 |
45 wyd011011daniel 2024 年 5 月 14 日 @zhousir5071 #44 我刚刚搞明白,大概流程是 1:美区下载 爱阅记 2:azure 申请密钥( visa 自己注册或者闲鱼买个号) 3: 将 Azure 密钥导入爱阅记 https://tts-importer.yfi.moe/ 使用爱阅记就可以听书了 txt equb 都支持 可以去 tts 设置里修改请求以添加风格强度 |
46 wyd011011daniel 2024 年 5 月 14 日 @zhousir5071 #44 azure tts 密钥申请 https://www.bilibili.com/video/BV1Ee411C7p5/ 微软 ssml 命令说明 可以照着这个修改自己想要的 https://learn.microsoft.com/zh-cn/azure/ai-services/speech-service/speech-synthesis-markup-voice#use-speaking-styles-and-roles |
47 zhousir5071 2024 年 5 月 14 日 via iPhone @wyd011011daniel 感谢你的耐心指导,我已经根据你说的链接把我申请的 azure 密钥填入 API key 了,但是在爱阅记里面,还是没有找到如何调用微软 tts |
48 zhousir5071 2024 年 5 月 14 日 via iPhone @wyd011011daniel 已经会了,非常感谢你,这个爱阅记,超级好用! so nice of you ! |
49 wyd011011daniel 2024 年 5 月 14 日 @zhousir5071 #47 如果你完成了 https://tts-importer.yfi.moe/help/ireadnote 这里所说的复制链接导入爱阅记 那么你在爱阅记中打开一本书,点击右下角耳机按钮,然后点击左下角语音库管理,在上方有在线语音库,选择你导入的那个格式就可以。 下面是三张截图可以提供一些参考 ![]() ![]() |
  50 zhousir5071 2024 年 5 月 21 日 via iPhone @wyd011011daniel 这个爱阅记有一个很烦人的缺点,读着读着他就自动切到系统机器人的声音了。不知道有没有什么办法解决,或者联系开发者。或者还有更好的软件吗? |
51 wyd011011daniel 2024 年 5 月 21 日 @zhousir5071 #50 目前没有遇到过,我一般听半小时以内,再长就睡着了。联系开发者可以试试 appstore ? 具体不太清楚 其他软件 如果接受安卓就用阅读 我的博客写了安卓用法可以看看 https://daniel011011-cdn.gitblog.xyz/posts/5 |
52 zhousir5071 2024 年 5 月 21 日 via iPhone @wyd011011daniel 好的,我试了这个“语音中心”不错,没有自动切换到机器人的声音。也有一个小问题,就是起步播放时,反应迟钝。 |