别在用 GPT 的 API 了,自己训练一个 GPT3 LIKE 吧,成本几十美金 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
cattrace
V2EX    OpenAI

别在用 GPT 的 API 了,自己训练一个 GPT3 LIKE 吧,成本几十美金

  •  
  •   cattrace 2023-03-25 09:44:16 +08:00 4955 次点击
    这是一个创建于 930 天前的主题,其中的信息可能已经有所发展或是发生改变。
    14 条回复    2023-03-27 07:32:17 +08:00
    swulling
        1
    swulling  
       2023-03-25 09:49:18 +08:00
    还是得看效果。

    技术上有一个可用的临界点,低于这个点就没有产品化的必要。
    swulling
        2
    swulling  
       2023-03-25 09:50:05 +08:00
    目前看这个临界点在 GPT 3.0 和 3.5 之间,3.0 其实已经出来挺久了,但是一直不温不火,就是因为它没有越过临界点。
    cattrace
        3
    cattrace  
    OP
       2023-03-25 10:00:41 +08:00
    @swulling 最后拼的是高质量数据

    今天打算搞一波试试
    Merlini
        4
    Merlini  
       2023-03-25 10:01:05 +08:00
    其实部署模型也是一个很复杂的事情,这种大模型本地用还可以,如果想把他做成服务,那需要下太多功夫了
    zhleonix
        5
    zhleonix  
       2023-03-25 10:01:07 +08:00   1
    搞一些领域专用模型作为助理工具够用了,也容易在企业应用里面集成。
    cattrace
        6
    cattrace  
    OP
       2023-03-25 10:03:42 +08:00
    @zhleonix 赞同
    dacapoday
        7
    dacapoday  
       2023-03-25 11:25:04 +08:00
    @swulling 不过作为追赶者,可以试试找到达到这个临界点所需的最小数据集。进而让模型实现 portable ,打破巨头垄断的局面。
    iloveoovx
        8
    iloveoovx  
       2023-03-25 11:34:21 +08:00
    关于这个临界点其实需要注意自己思维里的盲点
    我们会认为是技术上线性提升,是一种增量思维
    表面上看也的确符合,多用了 RLHF
    但这是关键了,RLHF 可以通过被训练好的 model 迅速传递到下一个 model 里。也就是说,openai 吃了螃蟹,别人可以很低成本地消化它吃过的。
    同时,175B 参数一定是那个临界点的阈值吗?不一定。6b + RLHF 说不定也行,可能会好过纯粹 175b 的能力。就这一个变量,就导致线性思维毫无用处,基本会把自己带坑里错过机会
    zagfai
        9
    zagfai  
       2023-03-25 18:24:16 +08:00
    3.5 和 4 就是小学生和高三生的差距
    Wenbobobo
        10
    Wenbobobo  
       2023-03-25 18:46:23 +08:00 via Android
    这个和斯坦福那个羊驼 lora 有什么区别?
    cattrace
        11
    cattrace  
    OP
       2023-03-25 21:28:20 +08:00 via iPhone
    @Wenbobobo 借鉴了那个,这个主要是训练成本很低,作者说是几十美元就有 gpt3 差不多的效果,具体得亲自试试才知道
    leimao
        12
    leimao  
       2023-03-26 00:17:06 +08:00
    低质量的数据集容易生成低质量的模型不说,模型还可能受数据集质量产生各种仇恨负面等言论。这也就是为什么 OpenAI 的模型都有 Human-In-The-Loop ,他的模型说话可以让人接受。
    Wenbobobo
        13
    Wenbobobo  
       2023-03-26 16:48:36 +08:00 via Android
    @cattrace 这个有部署的 colab 或者教程嘛,好像没找到。之前斯坦福有 colab
    cattrace
        14
    cattrace  
    OP
       2023-03-27 07:32:17 +08:00 via iPhone
    @Wenbobobo git 里有写 用 darabricks
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2974 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 12:09 PVG 20:09 LAX 05:09 JFK 08:09
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86