用你自己的数据, 5 分钟训练一个专属 ChatGPT,回答有据可依无幻觉 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
yeeisme
V2EX    推广

用你自己的数据, 5 分钟训练一个专属 ChatGPT,回答有据可依无幻觉

  •  1
     
  •   yeeisme 2023-06-13 23:02:27 +08:00 2572 次点击
    这是一个创建于 922 天前的主题,其中的信息可能已经有所发展或是发生改变。

    不用自己去研究 langchain ,折腾向量数据。 无服务器,面向接口,利用 http://aiproxy.io/ 提供的自定义垂直聊天机器人、知识库能力,5 分钟就构建一个自己的聊天机器人。 只需要添加您的网站链接、PDF 等数据,即可获得类似 ChatGPT 的聊天机器人。让它专注于回答您设定的知识,减少逻辑错误和生成幻觉,只基于对您输入材料的理解去回答问题。

    您还可以使用此能力,将自己在网络上阅读的微信公众号文章,研究资料或其他文本形式的内容添加到知识库,让它帮你深度理解并记录,成为你的第二大脑。

    每一个回答,都是可解释的,回答时还会引用内容来源文档,保证准确无误。

    感兴趣的,可以看详细的文档: https://docs.aiproxy.io/dev/library

    下面展示一个利用此能力,构建的 TG 产品智能问答机器人,把产品文档的链接提交一下,就自动生成了一个如下效果的智能客服。

    产品智能客服

    说个题外话,aiproxy 除了提供垂直数据 chat ,这还是一个非常专业的 openai 接口代理平台,长期使用的开发者和团队用户,最低 10%费率,国内网络访问方便,还是非常划算的。

    产品最近也上线了开发者开放平台,各大围绕 chatgpt 构建的应用、插件作者,欢迎来试试。也可以来拿个邀请链接,贴到自己的博客或者产品页,实现 GPT 自由。

    10 条回复    2023-06-14 19:58:05 +08:00
    aduangduang
        1
    aduangduang  
       2023-06-14 10:36:04 +08:00
    10 元人民币能兑换 10000 积分,每个 token 价格为 0.02 积分,因此 10 元人民币可以用 500 个 tokens 。
    ???
    你要不要看看自己在说什么?
    yeeisme
        2
    yeeisme  
    OP
       2023-06-14 12:26:12 +08:00 via iPhone
    @aduangduang 数字推理 gpt3.5 模型也就这个水平了。你调用时可以上 gpt4 ,能好点。
    yeeisme
        3
    yeeisme  
    OP
       2023-06-14 12:26:58 +08:00 via iPhone
    @aduangduang 你也可以禁掉基于给定知识的推理,文档有什么答什么
    RageBubble
        4
    RageBubble  
       2023-06-14 15:47:00 +08:00
    这有点像对 GPT 进行微调,只不过 openia 只提供了 davince 以下的模型,使用你们这个可以直接微调 gpt4 。
    我已经买了会员了,准备好好研究一下。
    RageBubble
        5
    RageBubble  
       2023-06-14 15:48:55 +08:00
    另外,你们的教程文档我无法使用 gpt4 的 web browsing 功能浏览,希望能让 gpt 访问,我有时候不想自己看文档
    yeeisme
        6
    yeeisme  
    OP
       2023-06-14 16:11:36 +08:00
    @RageBubble 因为现在官方就还没放出 browsing 的 api ,后续平台计划自己做,敬请期待
    yeeisme
        7
    yeeisme  
    OP
       2023-06-14 16:13:18 +08:00
    @RageBubble 微调的成本可太高了。这个模式,今天看有会员用,一篇微信公众号的文章训练目前大概消耗 1 个积分,10 块钱可以买 1 万篇公众号文章。微调模型固定资源应该是 10 万起步吧。
    当然这功能正式放开,肯定要收平台存储和计算资源的费用。
    RageBubble
        8
    RageBubble  
       2023-06-14 17:00:02 +08:00
    @yipengfei329 #6 我的意思,当时我给 gpt4 你们的网址,想让 gpt4 去读里面的文档,然后让它告诉我怎么使用,有哪些功能。结果他说你们的 robots 阻止了它访问。
    RageBubble
        9
    RageBubble  
       2023-06-14 17:20:41 +08:00
    还有一点就是,你们会怎么处理用户上传的训练数据?
    yeeisme
        10
    yeeisme  
    OP
       2023-06-14 19:58:05 +08:00 via iPhone
    @RageBubble 向量化后存储,机密数据还是不适合用,openai 也会得到最后总结环节数据的
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1380 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 29ms UTC 16:37 PVG 00:37 LAX 08:37 JFK 11:37
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86