圈友们好,前 PM 现独立开发的小白一枚,第一次发帖,希望加入到 V2EX 社区和大家一起学,同时分享一些自己的上站踩的坑,也算作为复盘的一种方式。
几个月前我瞄准了视频赛道,尝试用各种 AI 视频工具,结果发现一个共同点:要么太贵,要么太慢,要么没声音。于是我决定自己试试看,在这期间踩了 n 多的坑,把几个花了最多时间修复的坑分享出来。
一、要选取正确的 技术栈 & 架构 !!非常关键,不然后面代码容易改成屎山:
整个项目我自己独立开发,技术栈大概是这样的:
Next.js + Tailwind:前端和 UI
Supabase:用户系统 + 数据库
Serverless Functions:用于签发任务请求、轮询状态和更新结果
在接入 api 接口的的过程中,我踩的坑包括:
状态字段不统一( state / status / taskState 各种名字);
有时候返回字段变动,比如视频结果可能在 resultUrl 、mediaUrl 或 resourceUrl ;
授权签名有时间窗( SAS token ),过期就 401 ;
任务长时间未完成时还会触发“假 completed”。
我后来写了一个统一处理层,自动 fallback 字段、检测异常状态并生成结构化错误。 状态轮询也加了指数退避,避免被限流。
二、成本与优化
GPU 渲染费用比我想象中高不少。 为降低开销,我重新做了几个优化,站友可以建站的时候直接写进 cursor rules:
任务队列分层:短视频优先渲染,避免长任务堵住短任务;
状态缓存:api 接口状态变化频率不高,不用每秒轮询;
失败重试策略:502 / 429 自动退避重试。
目前平均生成时间大约 2 分钟。 我给新用户赠送了 50 积分,想收集不同 prompt 的反馈并吸引一些用户。测试阶段没有收费。欢迎大家免费试用,不收费希望能获取一些反馈,也欢迎群友多多交流,一起进步。大家点这链接可以直接获取积分免费试用 https://sora2openai.com/generate
三、开发过程的一些反思
我发现很多 backend 的工具其实挺强大的,但文档写得很抽象,需要自己摸索。 比如生成任务 ID 的字段,在不同模型下不一样,得手动 merge 才能稳定拿到视频链接。
现在我做了一个“状态统一器”,能自动判断任务是否真的完成, 并标注失败原因(算是 debug 最多的一段代码了 )。
四、下一步计划
加入 多语言配音(中/日/英)、支持自动加字幕、考虑开放一个简易 API 给其他开发者用
最后
我知道 V2EX 上很多朋友也在玩 AI 项目, 也想听听大家的意见:
如果你是视频创作者,你希望 AI 视频工具还多什么功能? sora2openai.com 这个站主要特点追的新词,同时有声音、无水印、生成挺快、比市场价格都便宜。但是感觉在红海市场没有突出产品特色。欢迎拍砖、提建议、或者单纯聊聊。真的希望把这个工具打磨得好用一点。
1 grabbywu 3 天前 套壳现在还有什么优势吗? |
![]() | 2 SayHelloHi 3 天前 |
![]() | 3 SayHelloHi 3 天前 任务队列 有啥第三方库 or 第三方服务推荐 漏了一个字 |
![]() | 4 Kelly00 OP @SayHelloHi hi 你好,1. 我是用的第三方的 api 接口视频生成的后端服务,不是自建队列系统( openrouter 、fal.ai 都可以看看),本地 Job 使用 Supabase 的数据库服务存储任务状态。2. VPS 使用 Vercel Serverless 平台,不是传统 VPS |
![]() | 6 ParallelMao 2 天前 |