
文案切片,合成音轨 
GPT 生成分镜 
DALL-E3 素材绘制 
一切就绪,准备生成视频 
视频生成完毕 
1 chanssl 2024-03-04 08:18:21 +08:00 via Android 现在抖音那些小说推文就差不多是这种流水线生产的 |
2 Rache1 2024-03-04 09:02:41 +08:00 类似的早就有了……,之前在 B 站都看到过,文案像是 GPT 生成,然后改改,配音用的 AI ,画面里面全是爬虫根据关键字抓的匹配的,加上过渡动画。 |
3 luckybigbear 2024-03-04 09:34:04 +08:00 期待后续更新,相信这里提升产出效率和准确性是一种创新,作为商业化产品的转变 存在过并不代表没有市场,人为干预的降低、明显的效率提升、画面及准确度的提升,都可以是在红海里杀出的利器 期待后续更新 |
4 maymay5 OP @Rache1 那是要人工干预和剪辑的,剪映自带这个功能,但是他们最大的缺陷就是吃不下长文本,我解决了长文本的问题 ,和一站式全自动解决方案 :-) |
6 ZnductR0MjHvjRQ3 2024-03-04 14:13:13 +08:00 @maymay5 问题是你这个长文分镜如何解决掉主角不一致以及上下文理解呢 |
7 maymay5 OP @Motorola3 目前没有解决这个问题,但是我在 [创意工坊] 中解决了这个问题,不用 DALL-E3 直接生成,以插件形式让 GPT4 调用,这样大语言模型就会继承历史记录的描述,当然缺点也很明显,token 消耗几何倍数增长 |
9 ZnductR0MjHvjRQ3 2024-03-04 14:35:17 +08:00 @maymay5 对啊 我之前就实践过这个问题了 几乎是误解的 除非 gpt 支持 lora 但是显然目前没有 |
10 maymay5 OP @Motorola3 其实 Plus 会员的做法就是以插件形式调用 DALL-E3 的,虽然上下文中的角色绘制会出现差异,但是基本能保持一致的画风,我其实并不期望 GPT 生成的营销视频有很高的质量,而是能保证一些基础元素能成功合成,毕竟现在的短视频,素材也不见得很衔接 |
11 maymay5 OP @luckybigbear 谢谢,没那么大野心哈哈,但是会保持更新 |
12 adorehb 2024-03-04 19:53:00 +08:00 无法注册账号 |