给我的 ChatGPT 加了语音功能,貌似效果还行 - V2EX
nonfu
V2EX &nbp;  OpenAI

给我的 ChatGPT 加了语音功能,貌似效果还行

  •  1
     
  •   nonfu Mar 10, 2023 5731 views
    This topic created in 1163 days ago, the information mentioned may be changed or developed.

    昨天给我的克隆版 ChatGPT - GeekChat 加了语音支持(语音识别由 OpenAI Whisper 模型驱动):

    貌似效果还行,感兴趣的可以试试:GeekChat - 免费体验版 ChatGPT

    另外,大家有什么好的靠谱的中文语音 API 欢迎给我推荐,之前没怎么接触过这块。

    Supplement 1    Mar 10, 2023
    大家测试下就好 能少用少用哈 手下留情 这个 API 费用估计这个月得好几百美金。。。
    Supplement 2    Mar 13, 2023

    周末把前端 UI 重构了一下:

    30 replies    2023-03-13 09:27:55 +08:00
    xujinkai
        1
    xujinkai  
       Mar 10, 2023 via Android
    离涩涩聊天机器人又近了一步
    tianyou666shen
        2
    tianyou666shen  
       Mar 10, 2023
    拿来练习英语是不是也蛮好用的
    nonfu
        3
    nonfu  
    OP
       Mar 10, 2023
    @tianyou666shen 嗯 是的
    laixy9527
        4
    laixy9527  
       Mar 10, 2023
    题主是用的哪款语音软件或接口?方便透露么
    vsitebon
        5
    vsitebon  
       Mar 10, 2023
    @laixy9527 #4 题主的帖子里面说了,用的 OpenAi Whisper
    Metre
        6
    Metre  
       Mar 10, 2023   1
    结果也搞成语音~
    redditer
        7
    redditer  
       Mar 10, 2023
    考虑开源吗?
    AoEiuV020CN
        8
    AoEiuV020CN  
       Mar 10, 2023
    现在看 chatGPT 的回复都会脑补出老高小茉的声音,感觉他们小茉念 chatGPT 的回复声音非常合适,
    shuxiaokai
        9
    shuxiaokai  
       Mar 10, 2023 via Android
    tf2
        10
    tf2  
       Mar 10, 2023
    真好。没有叫 geeker
    Depth
        11
    Depth  
       Mar 10, 2023
    我已经看到基于 ChatGPT 的英语口语对话练习程序了。很好,很强大!
    nonfu
        12
    nonfu  
    OP
       Mar 10, 2023
    @laixy9527 我用的 OpenAI 接口啊 speech to text 基于最近发布的 Whisper 模型
    nonfu
        13
    nonfu  
    OP
       Mar 10, 2023
    @Metre 可以的啊 把文本生成语音就好了 这种 AI 软件也挺多的 不过成本就上去了 个人扛不住。。。OpenAI 都用不起 我看已经超免费限额了
    nonfu
        14
    nonfu  
    OP
       Mar 10, 2023
    @redditer 已经开源 在 Github 上 你可以关注我的博客: https://geekr.dev ,这两天会把开发过程更新进去 之前写了一篇没有语音的
    nonfu
        15
    nonfu  
    OP
       Mar 10, 2023
    @AoEiuV020CN 哈哈 同好
    nonfu
        16
    nonfu  
    OP
       Mar 10, 2023
    @lambdaq kr 多有感觉 氪星人 化学元素 还有这不能少写一个字母嘛
    nonfu
        17
    nonfu  
    OP
       Mar 10, 2023
    @Depth 理论上没啥问题 个人扛不住这个成本 做个玩具可以 公司就随意了
    runliuv
        18
    runliuv  
       Mar 10, 2023
    和小爱同学差不多了。
    cuicuiv5
        19
    cuicuiv5  
       Mar 10, 2023   1
    我正准备做一个类似的语音助手, 搭配微软 Azure 的 TTS, 效果一定很棒
    微软的 api 似乎可以流式传输, 这样可以让他逐字读出来, 体验更好, 不会卡顿
    icatme
        20
    icatme  
       Mar 10, 2023
    我想用 ESP32 开发板做一个聊天玩具, 语音->文字->GPT API->TTS 输出
    nonfu
        21
    nonfu  
    OP
       Mar 10, 2023
    @runliuv 小爱同学这种没啥技术含量 API 应该都是调用别人的 自己买个树莓派是不是也能做
    nonfu
        22
    nonfu  
    OP
       Mar 10, 2023
    @cuicuiv5 嗯 我也试试
    nonfu
        23
    nonfu  
    OP
       Mar 10, 2023
    @icatme 没毛病 我最近也想倒腾个硬件玩玩
    aogg
        24
    aogg  
       Mar 10, 2023
    输入框要支持 shift + enter 功能进行换行
    nonfu
        25
    nonfu  
    OP
       Mar 10, 2023
    @aogg 嗯 后面可以优化 这个只是体验版 不是 ChatGPT 的替代品 也不打算这么做 所以不会做的很重
    sniperhgy
        26
    sniperhgy  
       Mar 10, 2023
    感觉和 Chatgpt 有相同的特性:张嘴就来



    盟军敢死队一共有几代


    GeekChat
    盟军敢死队游戏共有三代。



    盟军敢死队一共有几代,每一代叫什么


    GeekChat
    盟军敢死队游戏共有三代,每一代分别叫做:

    Command & Conquer: Red Alert - Allied Disc
    Command & Conquer: Red Alert 2 - Allied Campaign
    Command & Conquer: Red Alert 3 - Allied Campaign


    commandos behind enemy line 在中国叫什么


    GeekChat
    《无声敌线》( Wú Shēng Dí Xiàn )是 Commandos: Behind Enemy Lines 在中国的官方翻译名称。
    nonfu
        27
    nonfu  
    OP
       Mar 10, 2023
    @sniperhgy 就是调用 chatgpt api 接口 能不一样吗
    poyanhu
        28
    poyanhu  
       Mar 10, 2023
    要是答案也是读出来的语音。那可以拿来学习外语了。
    nonfu
        29
    nonfu  
    OP
       Mar 11, 2023
    @poyanhu 目前 OpenAI 没有提供相关接口 不过其他厂商有这种 API 的
    busuzhike
        30
    busuzhike  
       Mar 13, 2023
    赞,相当好,问了好几个问题,拜票了,谢谢
    About     Help     Advertise     Blog     API     FAQ     Solana     3025 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 101ms UTC 06:19 PVG 14:19 LAX 23:19 JFK 02:19
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86