做了一个 AI 生成儿童图文故事书的应用 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
qzhai
V2EX    分享创造

做了一个 AI 生成儿童图文故事书的应用

  •  2
     
  •   qzhai 023-08-24 14:24:20 +08:00 3239 次点击
    这是一个创建于 789 天前的主题,其中的信息可能已经有所发展或是发生改变。

    现有功能:

    1. 只要输入一段话就会基于这段话生成一个故事开头
    2. 然后可以选择接下来的故事走向
    3. 会根据生成的内容生成对应的图片
    4. 内容可以语音播放
    5. 可以生成视频和长图

    因为生成中文不是很咋地,目前是个英文版本。 欢迎试用!!


    创建页: https://www.mystorybooks.fun

    已生成故事: https://www.mystorybooks.fun/gallery.html

    第 1 条附言    2023-08-30 21:44:11 +08:00
    我们又翻译了一个中文版 https://www.mystorybooks.cn/
    26 条回复    2023-12-22 12:58:32 +08:00
    hellofreckles
        1
    hellofreckles  
       2023-08-24 15:42:31 +08:00
    小建议:可以提前加载下一页的音频文件
    uiluck
        2
    uiluck  
       2023-08-24 17:23:23 +08:00
    想知道里面图片是哪里来的? Sd 生成的吗?
    qzhai
        3
    qzhai  
    OP
       2023-08-24 18:13:08 +08:00
    @uiluck 嗯,生成的
    NCZkevin
        4
    NCZkevin  
       2023-08-27 01:16:11 +08:00
    楼主这个看上去做的很专业呀,好奇付费情况
    Solix
        5
    Solix  
       2023-08-30 21:57:34 +08:00 via iPhone
    我觉得你得想想场景在做,建议网站针对家长,在做一个客户端针对孩子,家长要能监管孩子,这才有人用
    em70
        6
    em70  
       2023-08-30 23:10:35 +08:00
    如何解决连续图的问题的,不连续很难讲出好故事
    kristol07
        7
    kristol07  
       2023-08-30 23:55:39 +08:00 via Android
    @em70 是个好问题,这里的连续图问题除了这个是否还有一个是图片的一致性,比如前面的图的主人公是一直松鼠,后面的图生成的虽然也是松鼠但是长得有些不一样,这个应该不能简单地靠 sd 的文生图来实现。(没有试用过,只是个人疑问)
    vinbor
        8
    vinbor  
       2023-08-31 10:17:59 +08:00 via Android
    ui 做的好好看
    haoxuexiaoyao
        9
    haoxuexiaoyao  
       2023-08-31 10:36:33 +08:00
    哪里可以学习下这个
    qzhai
        10
    qzhai  
    OP
       2023-08-31 11:46:06 +08:00
    @haoxuexiaoyao 你想学习什么 ?
    qzhai
        11
    qzhai  
    OP
       2023-08-31 11:47:46 +08:00
    @kristol07 是的一致性确实是我们开发中遇到的问题,但是目前已经有解决方案
    zyxcompany
        12
    zyxcompany  
       2023-08-31 15:57:40 +08:00
    真心不错 建议加一个下一页的按钮 或者点击继续下一页的温馨提醒
    DjvuLee
        13
    DjvuLee  
       2023-08-31 16:04:53 +08:00
    好奇为什么因为生成中文不是很咋地的呢?
    qzhai
        14
    qzhai  
    OP
       2023-08-31 17:21:30 +08:00
    @zyxcompany 嗯嗯~在考虑加了
    ningshen8
        15
    ningshen8  
       2023-08-31 18:22:21 +08:00
    真的厉害,能解决角色一致性的问题,就无敌了,不过貌似没有什么好的方案。不过现在这个版本已经很强了。甚至可以录屏后发到短视频平台搞流量。
    time2023
        16
    time2023  
       2023-08-31 19:22:56 +08:00
    感谢楼主,孩子瞟了一眼就喜欢上了。支持
    haoxuexiaoyao
        17
    haoxuexiaoyao  
       2023-08-31 20:45:09 +08:00
    想学习下做这样的应用 @qzhai
    yiyongopt
        18
    yiyongopt  
       2023-09-01 11:27:16 +08:00
    哈哈,真厉害,我才刚有想法,没想到产品都已经有了
    bshu
        19
    bshu  
       2023-09-01 11:30:32 +08:00
    生成的配图很棒,只是故事吗,不太放心
    iOCZ
        20
    iOCZ  
       2023-09-01 11:31:20 +08:00
    故事书翻页有问题,点一下翻页,翻完还会重新翻一次
    icyalala
        21
    icyalala  
       2023-09-01 11:37:31 +08:00
    我之前也调研过后来放弃了,主要原因一个是角色形象前后不一致,很难控制。
    还有就是版权问题,比如我在第一页看到了小猪佩奇...
    icyalala
        22
    icyalala  
       2023-09-01 11:42:07 +08:00
    @icyalala 但是我见过网上很多这种生成的视频或者图文,浏览量也不小,似乎角色不一致或者版权这种细节问题很多人并不在乎,所以我觉得个人作者可以尝试搞搞。
    lingxy
        23
    lingxy  
       2023-09-01 12:16:31 +08:00
    朗读的是调用的哪个
    HGXs1LdZRPSi5O9e
        24
    HGXs1LdZRPSi5O9e  
       2023-09-01 14:26:23 +08:00
    已注册,给楼主点赞!好奇这个生成模型是直接调用的现成接口,还是自己重新训的?
    justin2018
        25
    justin2018  
       2023-09-02 22:06:36 +08:00
    看了别人生成的故事

    封面的动物都很好看

    进入看故事内容 图片的动物主角和路人角色

    都不是很搭配看着不连贯
    adorehb
        26
    adorehb  
       2023-12-22 12:58:32 +08:00
    可以+ v 了解一下吗 adorehhhhhb
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5362 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 33ms UTC 07:38 PVG 15:38 LAX 00:38 JFK 03:38
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86