在学习李鸣的精神分析视频课程时,我发现笔记的过程往往因频繁暂停和回放而变得低效。因此,我构想了一种更理想的学习方法:
首先自行观看视频,对重点部分有一个大致的印象,并注意教师讲解以外的信息。 使用 Whisper 将音频转换为文本,然后利用 GPT 技术提炼重点,形成总结性笔记,以便集中复习和消化。 粗略搜索了一下,还没发现成熟的相关应用。
针对冷门影视资源,难以找到高质量字幕。 视频学习过程中需要反复观看,而在做总结笔记时效率低下。
提供两种使用方案:
待调研补充。
1 google2020 2024-01-03 18:18:26 +08:00 竞品研究的话,B 站有这种产品了,有好几个账号,只要你在视频下面 at 它,它就会在评论区发视频总结,我看过账号介绍,没写是哪家的产品。抖音快手也在搞的,不过很傻缺,比 B 站那几个差很多。 |
![]() | 2 wonderfulcxm 2024-01-03 18:22:46 +08:00 via iPhone 那我也做个 VideoGermini |
![]() | 3 HHHans OP @wonderfulcxm 哈哈可以 做好了我再照着抄 |
![]() | 4 HHHans OP @google2020 嗯这个我知道,但 b 站那个凝练度太高了不适合严肃学习 |
![]() | 5 HHHans OP 试着让 GPT 给这个产品起名字,它起的还挺好哈哈 智听摘 / ZhiTingZhai:结合了“智能”和“聆听摘要”的概念。 声纪精编 / ShengJiJingBian:意指从声音中提取并精心编排信息。 语流笔记 / YuLiuBiJi:突出从流动的语言中提取笔记或要点。 聆摘字幕 / LingZhaiZiMu:强调聆听和摘要的同时,生成字幕。 智能语摘 / ZhiNengYuZhai:结合智能处理和语言摘要的特点。 英文名称: AudioSummarizer:直接描述了音频摘要的功能。 CaptionWave:结合“字幕”和“波浪”(象征音频波形)。 SoundDigest:强调对声音内容的精简和消化。 EchoScribe:暗喻声音的回响和记录功能。 ListenNote:结合了听和记录笔记的功能。 |
![]() | 6 vevlins 2024-01-03 19:55:31 +08:00 需求我觉得没问题,但是商业化前景感觉不怎么好,成本有点高,需要经常总结视频的人感觉不多吧? |
7 ethenzh 2024-01-03 20:21:15 +08:00 via Android 我在用一个有类似功能的 app ,不过是给播客的,snipd |
![]() | 10 loadingimg 2024-01-04 09:04:51 +08:00 你说的是通义千悟 |
![]() | 11 compilelife 2024-01-04 09:19:42 +08:00 你说的点子非常好 科大讯飞有类似的产品,他做的是面向会议的: https://huiji.iflyrec.com/ 实时转录,记笔记的时候可以关联到对应的音频段。并且可以基于转录后的文本,通过 AI 对话的方式做摘要提取、问答等。 稍微转变下就是你想做的了 其实关于频繁暂停的问题,只需要“在笔记文本框输入时自动暂停;在笔记文本框失焦时继续播放”即可。然后将笔记与时间点关联,以后回看的时候就方便了。 至于总结性的笔记,我个人感觉意义不大,因为不同人看同一个视频他接收的信息是不同的,基于转录文本的问答才能“千人千面” |
![]() | 12 compilelife 2024-01-04 09:25:38 +08:00 对于盈利部分,我也讨论下。 从用户的角度看,我认为一个开盒即用的傻瓜式产品才是好产品。所以,应该是技术上将 GPT 的所有细节隐藏,软件尽可能支持所有视频网站(比如是一个通用浏览器的插件,自动识别网站的视频画面和音频,参考“Live Screen Recorder") |
![]() | 13 simo 2024-01-04 10:09:21 +08:00 做过类似的,方案上没有问题。ocr 和 视频处理,都放到队列,分布跑。 付费群不大的话,成本估计回不来。 自己玩玩完全没问题 |
![]() | 14 seekafter 2024-01-04 10:25:59 +08:00 感觉不错,挺一下 |