![]() | 1 sakujo 2023-04-23 23:03:51 +08:00 是不是聪明一点的小爱音响?那倒是挺不错的 |
![]() | 2 Jackyxiaoc OP @sakujo 是的,用来哄哄小朋友什么的,练习下英文对话啥的,看上去还不错。 |
![]() | 3 sakujo 2023-04-23 23:26:35 +08:00 @Jackyxiaoc #2 有点意思 不过如果问它有用的信息它会胡说八道啊 这样没办法当语音助手了 |
4 lloovve 2023-04-23 23:50:33 +08:00 via iPhone 你能保证稳定才行,树莓派太贵,直接上 esp32 |
![]() | 5 demen 2023-04-23 23:51:10 +08:00 其实交互过程感觉挺难受,你问一个问题之后几十上百字的内容用语音播放来听取?平时我们微信聊天看到超过 10s 的语音都有点翻白眼了吧 |
![]() | 6 viWww0vvxmolvY5p 2023-04-23 23:58:51 +08:00 有兴趣 |
7 luckjoe680 2023-04-24 00:06:36 +08:00 via Android 问题是 小爱音箱就能办到了…也用不了 300 啊… |
![]() | 8 musi 2023-04-24 08:06:53 +08:00 via iPhone 太贵了,为啥不用手机? |
![]() | 9 Tink PRO 树莓派太贵了 |
![]() | 10 Tink PRO ![]() 这个价格不如买黑板的初代小爱音箱,破解 ssh 后 劫持语音转到 c hatgpt |
![]() | 11 jimbray 2023-04-24 08:26:03 +08:00 @demen 同意,之前用手机实现了一下语音问答,问一句,答得太多了,用语音播放有点难受,换成文字一下就看完了。纯问答我觉得没有什么意思。 |
12 yuchenxing 2023-04-24 08:45:28 +08:00 怎么搞 |
13 hoky 2023-04-24 08:52:51 +08:00 via iPhone 为什么不直接用闲置的手机? iPhone 用 Siri Android 用 Tasker 我都试过玩过一阵子 后来因为直连 openai 响应慢玩的不多了 |
![]() | 14 totoro625 2023-04-24 08:55:34 +08:00 iPhone 安装 OpenCat: https://apps.apple.com/app/opencat/id6445999201 填入 api key ,开启高级版,并开启 Siri 支持 任意支持 Siri 的 iPhone/apple watch 均可用 Siri 调用 chatgpt 进行对话 |
15 Biluesgakki 2023-04-24 09:20:00 +08:00 如何做到流式传输结果 传回来一个字读一个字呢。不然的话响应时间太长了,需要等到全部返回结果才开始读 |
![]() | 16 timeance 2023-04-24 10:07:28 +08:00 1. 树莓派的方案太贵 2. 硬件部分,基本功能调通,麦克风如何降噪拾音等 3. 软件部分怎么完善,例如 prompt ,唤醒和本地识别语音指令等 ... 想法挺好的,要是真有完善的方案 会买一个来玩 |
![]() | 17 yfmir 2023-04-24 10:36:15 +08:00 就目前这 api 的连接环境来看还是算了吧 |
18 littleBink 2023-04-24 10:40:42 +08:00 gpt 大部分回答都很长且书面,需要测试大量的 prompt 来优化 |
19 aeli 2023-04-24 11:10:36 +08:00 反应速度现在还不太行,GPT3 的回答虽然快,也要 1-2 秒,然后再转成语音发声,延迟会感觉比较明显的卡顿。 GPT4 就不用说了,能正常时间内给你返回就不容易了 |
![]() | 20 zagfai 2023-04-24 11:31:53 +08:00 可以接入米家就行,我不需要很智能,当然,我能给出传感器数据能帮我判断我是不是睡醒,自动开关窗帘,判断我啥时候会回家自动帮我开空调,那也不错。 |
![]() | 21 ropzislaw 2023-04-24 11:53:17 +08:00 via Android 这个 idea 我也有过,最后被劝退了 1. 需求多了生产线怎么弄,如何保证自己的生产线成本低 2 延迟和输出延迟 3 实时数据缺失 |
![]() | 22 Jackyxiaoc OP @mway 感谢。 @luckjoe680 小爱的智能水平和 chatgpt 不太一样。 @lloovve 感谢,我研究下。 @musi 在家常驻使用比较舒服。 @Tink 确实是个好办法,感谢。 @yuchenxing 我研究下路径,如果可以的话,一起拼个单,组好了大家用,成本就下来了。 @hoky 还是得有稳定的通道。 @totoro625 长时间接着电源的小音箱在家小朋友什么的好玩。感谢,我研究下。 @Biluesgakki 流式的话,这个得研究下。大概 10 个字一读会不会好点。 @timeance 感谢支持,我研究下。 @yfmir 估计得内置一个通道才行。 @aeli 目前看是的。看看有没有更好的解决方案。 @zagfai 如果更智能应该是个更好的体验。 @ropzislaw 只是一个初步想法,天猫精灵的话二手成本是挺低的。如果单纯是树莓派的解决方案,树莓派也不会很贵。延迟这个通道可以解决。实时数据的话,可以导入谷歌的。 感谢各位大佬们的建议。 |
![]() | 23 tags 2023-04-24 13:51:38 +08:00 不错不错,可以先在 linux 虚拟机上把系统搭起来,后面用啥硬件平台可以再说 |
![]() | 24 Dream4U 2023-04-24 13:55:45 +08:00 Siri 上用了,其实很无聊,简单问题还行,太长的听起来很累 |
25 freetree 2023-04-24 13:57:41 +08:00 via Android 华强北听到了你的呼求 |
![]() | 26 yulgang 2023-04-24 14:01:28 +08:00 想法不错,但是树莓派成本有点高。。 |
![]() | 28 yulgang 2023-04-24 14:05:14 +08:00 如果你能开源的话,大家喜欢,可能会衍生出多个版本,不过一定会有人用你的开源代码拿去赚钱。 |
![]() | 29 Jackyxiaoc OP |
![]() | 30 dangyuluo 2023-04-24 16:09:58 +08:00 直接用 Siri 就可以接入 ChatGPT 了 |
![]() | 31 Jackyxiaoc OP @dangyuluo 不知道咸鱼上 300 的 6s 能不能跑,如果可以的话,也是不错的选择。 |
![]() | 32 cloudzqy 2023-04-24 17:31:36 +08:00 这种自己走微软云文字转语音的,一般用什么方案识别关键字然后开始对话呀,如果一直开着的话,微软云也挺贵的。 |
![]() | 33 westoy 2023-04-24 17:39:57 +08:00 做公开服务成本太高了吧 京东的那个叮咚音箱都倒闭了....... |
![]() | 34 zapper 2023-04-24 17:42:12 +08:00 看了一下(可能是生成的)产品介绍。发现好像没说如何正确地拾音给 chatgpt 所谓悲观者常常正确,乐观者往往成功。如果能接入插件将绝杀 |
![]() | 35 tags 2023-04-24 17:44:54 +08:00 唤醒词本地离线模型就能跑 |
![]() | 36 Jackyxiaoc OP |
37 webdesigner 2023-04-24 19:23:27 +08:00 via iPhone 从我使用 gpt 连接 siri 的体验来看,这个项目做出来体验会很差。api 目前要么用 sse 逐字输出,要么牺牲响应时间等待全部结果。逐字输出文字转语音效果会很差,一个一个字朗读。等待全部结果在朗读,用户响应时间特别长,你无法想象当你问完一个问题,就得等待十几秒钟来告诉你答案。如果这个方案可行,大厂早就整出来了。 |
39 wellqq 2023-04-24 21:26:45 +08:00 via Android 按你目前的阶段,感觉离成品还有一些路要走,不过有出来体验好我会买,有众筹通知一下 |
40 fresco 2023-04-25 00:10:37 +08:00 via iPhone 一直在找能语音对话的 app ,这个想法不错,成本低点就好了 |
41 luckjoe680 2023-04-25 07:21:45 +08:00 via Android @Jackyxiaoc 你可以看看 现在 chatgpt 现在已经有大佬接入小爱了 而且还很方便=.= |
![]() | 42 Jackyxiaoc OP @webdesigner 确实,可能还需要看看有没有更好的方案啦。 @wellqq 好的,谢谢支持。 @fresco 嗯嗯,谢谢。 @luckjoe680 如果有大佬折腾出来卖成品的话就不折腾了,等我看看,之前没看到。感谢提醒。 |
43 aeli 2023-04-25 10:06:05 +08:00 如果说成品的话,找 amaon 的音箱,它家的很容易开发改第三方,YouTube 上有人放出来教程改 ChatGPT 的 |
44 Smackgg 2023-04-25 10:46:33 +08:00 小爱 小度 自己写一个插件不就做到了?小度六七十块钱就能买到 |
![]() | 45 xuelu520 2023-04-25 11:25:50 +08:00 需要短平快的对话,gpt 一大堆文字,给你转成语音,太难受了 |
46 xinyana 2023-04-25 12:43:34 +08:00 via Android 墙的问题怎么搞定?内置墙? |
47 xsen 2023-04-25 14:09:17 +08:00 现在 chatgpt 的模型,只适合用来替代搜索引擎、客服类似的 用来做 ai 助理(语音对话)是真不合适,长篇大论、废话太多 |
![]() | 49 cloudzqy 2023-04-25 14:27:29 +08:00 @webdesigner 这种可以折中一下,识别到标点符号断句就开始读,一句一句读,比小爱音箱什么的肯定慢,但是应该没十几秒。 |
50 luobogooooo 2023-04-25 22:43:13 +08:00 笑到了,哈哈哈 |
51 hoopan 2023-04-26 09:39:35 +08:00 家里有台待机的 NAS ,增加个麦克风、音响,是不是也能搞成 AI 音箱。 有基于 chatgpt 的语音助手开源服务端吗? |
52 swxk521 2023-04-26 23:36:53 +08:00 |
![]() | 53 unii23i 2023-04-27 11:49:35 +08:00 这个真的很需要!我经常和天猫精灵对线 |
54 zsrex 2023-05-08 15:32:18 +08:00 这个我感兴趣,之前折腾了一下 wukong-robot ,但 ubuntu 的系统太难搞了,可能我没有这个基础。 |
55 smjbwyhhhh 2024-05-09 01:27:18 +08:00 这么多 DIY 教程,怎么就是没有一个拿出来卖的啊。。。。。 |