业余做的文本大模型训练 Saas 上线 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
graetdk
23.15D
V2EX    分享创造

业余做的文本大模型训练 Saas 上线

  •  2
     
  •   graetdk 2023-11-14 14:30:25 +08:00 102303 次点击
    这是一个创建于 696 天前的主题,其中的信息可能已经有所发展或是发生改变。

    众所周知,openai 太强了,以至于现在谈 AI 基本就等同于谈 chatGPT 或 GPT4 ,但是呢,我个人的感情很复杂,一方面我是 chatGPT 的重度用户,也很喜欢 openai ,但是,我依然不希望看到未来是一个只有 openai 的世界

    在几个月前我曾经用 chatglm-6b 训练过我自己的数字克隆: https://v2ex.com/t/931521#reply161

    此后的开源模型开始井喷,但其质量和 GPT 的差距依然巨大,我开始琢磨,能否通过微调的方式来增加开源通用大模型在某些垂直领域的表现,在尝试的过程中,我意识到,如果不降低训练的门槛,那这个可能性微乎其微,然后我和几个朋友就开始以兼职,远程,业余时间的方式完成了这个低门槛进行文本大模型训练微调的 Saas

    这就是模迪手: https://www.modihand.com (好的我也是硅谷的粉丝,我心头的美剧前三

    因为这是 V2EX ,所以我想我应该不用再详细说明训练和 embedding 的区别,虽然有很多人说「训练」的时候其实是在说 embedding 和 prompt 工程,但两者本质上就是完全不同的。训练改变了模型的参数,而 embedding 没有,只是从知识库匹配一段文本放到 prompt 里一起给模型。

    模迪手简单易用,只需要准备好数据集,在网页上点点点,然后就可以训练了,训练完成后的模型,可以在线调用,也可以直接导出模型文件。

    它的一些特点包括:

    • 几乎无门槛实现文本模型训练
    • 支持多种预置基底模型
    • 无需担心算力,环境部署等问题
    • 模型可代部署,支持 API 接口
    • 所有模型均提供完整的导出(可部署在自己的 PC 或显卡服务器上)

    当然目前也存在一些问题:

    • 国内访问较慢
    • 部分超参数不支持控制
    • 很多基底模型还没有支持
    • 文档完善度 60%
    • 定价策略比较粗糙

    考虑到现在 openai 的强大,这个拥抱开源大模型的项目其实前景很不确定,但我觉得它至少帮我解决了很多问题,我也觉得需要有这么一个东西(我还没有看到类似的)

    如果大家有有趣的想法或者有意思的数据集,可以评论或直接通过这个表单填写一下,我们可以提供模迪手的免费算力,让你能够训练出来玩玩看(我之前的一个不算太成功的例子: https://v2ex.com/t/945834#reply18

    模迪手: https://www.modihand.com/

    23 条回复    2023-12-12 15:12:29 +08:00
    nnccree
        1
    nnccree  
       2023-11-14 14:58:08 +08:00
    为啥网站没有加上英文,面向海外用户?
    graetdk
        2
    graetdk  
    OP
       2023-11-14 15:01:22 +08:00
    @nnccree 刚开始,之后加
    my6777637
        3
    my6777637  
       2023-11-14 15:47:31 +08:00
    好酷,先 mark ,后面玩玩
    训练好后,对外服务的接口会和 openai 的接口保持一致吗?(方便平替)
    vulgur
        4
    vulgur  
       2023-11-14 15:47:59 +08:00
    Always blue !
    graetdk
        5
    graetdk  
    OP
       2023-11-14 15:49:01 +08:00
    @my6777637 感谢!我们提供的接口并不建议用于实际业务,仅仅是提供一个测试,后续可能会有更稳定的部署系统,但还是推荐用户训练好模型之后下载,自己部署
    graetdk
        6
    graetdk  
    OP
       2023-11-14 15:49:32 +08:00
    @vulgur 那个我还真想买一个,亚马逊看到要一百多
    milukun
        7
    milukun  
       2023-11-14 15:50:30 +08:00
    COOL
    cijianzy
        8
    cijianzy  
       2023-11-14 15:53:25 +08:00
    吼!
    vulgur
        9
    vulgur  
       2023-11-14 15:55:09 +08:00
    @graetdk 刚搜了一下,Switch Pitch Ball ,淘宝上 35-70 不等,不过都没销量,PDD 上没有
    nno
        10
    nno  
       2023-11-14 17:21:49 +08:00
    微调没啥价值,会严重损坏模型的性能
    graetdk
        11
    graetdk  
    OP
       2023-11-14 19:39:59 +08:00
    @nno 之前的模型微调后丧失某一方面能力的情况比较明显,但现在的模型都好了很多,另一方面如果需要加强的是模型的特定能力,那损失其它(不需要的)泛化能力也不是不能接受
    jr55475f112iz2tu
        12
    jr55475f112iz2tu  
       2023-11-14 19:59:57 +08:00
    感觉有点看头
    我看文档里的训练集举例都是一问一答的知识性对话,如果是像动画里的连续多轮对话数据,也可以作为训练集吗?
    graetdk
        13
    graetdk  
    OP
       2023-11-14 21:37:16 +08:00
    @czfy 可以的,那样数据集做起来会稍微麻烦点
    titanhw
        14
    titanhw  
       2023-11-14 22:32:26 +08:00
    希望可以加入 qwen-14b 模型,这个模型对比起来效果还是可以的
    graetdk
        15
    graetdk  
    OP
       2023-11-14 22:56:48 +08:00
    baka
        16
    baka  
       2023-11-15 00:52:31 +08:00
    智谱和百川的模型拿到商业化授权了吗?
    jr55475f112iz2tu
        17
    jr55475f112iz2tu  
       2023-11-15 00:56:23 +08:00
    @graetdk 可以举个例子吗?
    graetdk
        18
    graetdk  
    OP
       2023-11-15 09:32:07 +08:00
    @baka 虽然拿到了,但是其实我觉得这个不需要商业授权,因为本质上是算力服务,类似于某些云服务器提供模型镜像或者 GUI 给你操作差不多
    LeoSpeaker
        19
    LeoSpeaker  
       2023-11-15 10:12:55 +08:00
    大文本生成模型 推荐用哪个模型呢?
    graetdk
        20
    graetdk  
    OP
       2023-11-15 10:23:14 +08:00
    @LeoSpeaker 我个人是 chatGLM 的粉丝,并且目前我觉得 chatGLM3 是比较不错的
    w9ay
        21
    w9ay  
       2023-11-15 17:22:43 +08:00
    现在是有多少显卡支撑这个网站?
    LeoSpeaker
        22
    LeoSpeaker  
       2023-11-17 16:13:02 +08:00
    @graetdk 还请教您个问题,目前我也在研究了下 chatGLM ,确实很好用,请问您当前的训练是多少显卡呢?
    Eacls
        23
    Eacls  
       2023-12-12 15:12:29 +08:00
    我也是硅谷的铁粉,Pied Piper 反复的起起伏伏作为同样是创业者来看真的是精彩和刺激,当年的光荣岁月到最后却像是一点痕迹都没有留下过一样。Always blue ~ Always blue !
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2419 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 00:02 PVG 08:02 LAX 17:02 JFK 20:02
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86