公司想搞一个关于 AI 问答的知识库 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
hui9000
V2EX    机器学习

公司想搞一个关于 AI 问答的知识库

  •  
  •   hui9000 2023-12-12 09:13:49 +08:00 9415 次点击
    这是一个创建于 673 天前的主题,其中的信息可能已经有所发展或是发生改变。

    目前主要有俩需求:

    1. 对于常用知识进行问答,对于公司内部知识(如请假流程,内部代码建议等)可以训练并问答
    2. 可对于目前的内部流程,销售等进行建议;我们公司各个部门内部流程上千。

    感觉是需要大模型进行训练,但又苦于不知去哪找到合适的;部署的话可以利用公有云或者私有云都可;(公司内部有私有云) 常识性公开的问答可以用 chatgpt 我这边可以按照 api 进行弄个前端搞,基于 gtp3.5 但是内部流程的话或者销售数据公司领导不想给到外部进行训练。 请问有没有好的方式进行实施,交作业

    55 条回复    2024-03-01 17:35:13 +08:00
    Aruen8
        1
    Aruen8  
       2023-12-12 09:18:34 +08:00
    哪个公司呀?
    hui9000
        2
    hui9000  
    OP
       2023-12-12 09:21:12 +08:00
    @Aruen8 3 线非互联网公司。
    Solix
        3
    Solix  
       2023-12-12 09:25:54 +08:00 via iPhone
    首先买一个 a100 或者买至少 4 块 4090 ,然后找个中文开源大模型框架训练即可,然后训练完你需要 gpu 服务器部署或者用 a100 部署,不知道你们公司财力怎样,要求并发的话一个月至少话 1 万?
    sweat89
        4
    sweat89  
       2023-12-12 09:28:33 +08:00
    RAG
    linch97
        5
    linch97  
       2023-12-12 09:29:54 +08:00
    chatglm 6B 或者 13B ?这俩训练成本没那么高,只是问答应该也足够用了
    bk201
        6
    bk201  
       2023-12-12 09:30:25 +08:00
    找个外部提供服务的进行私有部署
    x86
        7
    x86  
       2023-12-12 09:31:35 +08:00
    luny
        8
    luny  
       2023-12-12 09:35:05 +08:00
    智谱 AI 大模型,好像可以私有化部署,算力要求不高,可以了解下
    0703wzq
        9
    0703wzq  
       2023-12-12 09:36:17 +08:00
    试试看这个能不能满足: https://github.com/labring/FastGPT
    listenfree
        10
    listenfree  
       2023-12-12 09:37:14 +08:00
    https://github.com/chatchat-space/Langchain-Chatchat

    找类似的 chatglm3 + langchain ,完成你说的两个任务,调整好参数,适当修改知识库内容,花不了多少钱。
    kidult
        11
    kidult  
       2023-12-12 09:41:51 +08:00
    3 楼的方案可以,用 gpt 的话肯定是要外泄数据的,如果只需要 3.5 的能力还是申请公司资源自己搞吧,搞完直接升职加薪
    c5QzzesMys8FudxI
        12
    c5QzzesMys8FudxI  
       2023-12-12 09:44:06 +08:00
    最近我也在研究本地化部署问答知识库,正在使用 FastGPT + M3E + chatglm3
    holysin
        13
    holysin  
       2023-12-12 09:48:45 +08:00
    上次开会听说很多公司都有对应的解决方案,但是肯定是要微调的,你们还得买几张卡....
    lozzow
        14
    lozzow  
       2023-12-12 09:51:29 +08:00
    我司有解决方案,要不要联系下,低成本
    PaulSamuelson
        15
    PaulSamuelson  
       2023-12-12 09:52:36 +08:00
    你看看这个https://segmentfault.com/a/1190000044459875#item-6
    这个是直接用人家现成的。你可以先试用一下,看看效果。
    它这个的优势是,只需要提供文档,然后就可以提问了。
    graetdk
        16
    graetdk  
       2023-12-12 10:04:16 +08:00
    churchmice
        17
    churchmice  
       2023-12-12 10:12:48 +08:00
    @graetdk #16 网页做的不错,然而随便聊几句真是呵呵
    lneoi
        18
    lneoi  
       2023-12-12 10:20:37 +08:00
    网上开源的可私有部署模型 + langchain 可以实现知识库相关的系统
    qdlidada
        19
    qdlidada  
       2023-12-12 10:29:26 +08:00
    我司有现成解决方案,可提供私有化部署,需要联系
    hui9000
        20
    hui9000  
    OP
       2023-12-12 10:34:15 +08:00
    @gaobh 财力还可以吧 ,一年流水 200 亿左右 上市公司,利润不高,主要可能上面想降本增效,都不好过
    hui9000
        21
    hui9000  
    OP
       2023-12-12 10:36:23 +08:00
    @x86 @0703wzq @listenfree @duanquanwu @graetdk 好的我试试,谢谢大家
    so1n
        22
    so1n  
       2023-12-12 1:41:37 +08:00
    hui9000
        23
    hui9000  
    OP
       2023-12-12 10:42:05 +08:00
    @lneoi OK 我找找 感谢回复
    karatsuba
        24
    karatsuba  
       2023-12-12 10:59:42 +08:00
    1.用 chatgpt 自带的功能挂 langchain 解决,缺点是收费
    2.用本地跑模型训练或者外挂知识库,缺点是有硬件门槛而且没有 chatgpt 好使
    RealJacob
        25
    RealJacob  
       2023-12-12 11:17:44 +08:00
    简单弄都不需要训练吧,弄个向量数据库存一下你们的相关信息,langchain 接一下 gpt 和这个向量数据库就完事儿了
    clino
        26
    clino  
       2023-12-12 11:58:15 +08:00
    王健硕的 chato 是不是就是搞这个的 https://chato.cn/
    就是不知道能不能私有部署
    em70
        27
    em70  
       2023-12-12 12:06:22 +08:00
    知识库不需要微调,通过向量库把资料给到 prompt 就行了,私有部署建议用通义千问 14B,是目前消费级显卡能跑的最好的中文开源模型,chatglm 问题太多了,6B 能力也有限. 更强的模型显存超过 24G,需要 A100,H100,你们买不得,也没必要
    mylastfire
        28
    mylastfire  
       2023-12-12 12:13:01 +08:00
    @em70 请问个人在家庭服务器上想部署知识库,您这个是最佳选择吗?
    kkhaike
        29
    kkhaike  
       2023-12-12 12:13:23 +08:00
    之前用 longchain 接过。。感觉效果不好,就像 gpt 帮你搜索出来结果打出来一样,不像从 gpt 自己嘴里说出来那样
    Hider5
        30
    Hider5  
       2023-12-12 12:30:17 +08:00
    fastgpt
    jingcoco
        31
    jingcoco  
       2023-12-12 12:33:23 +08:00
    从哪搞 GPU ,感觉现在方案好多,就缺价格合适的显卡
    zhumengyang
        32
    zhumengyang  
       2023-12-12 14:04:46 +08:00
    em70
        33
    em70  
       2023-12-12 14:09:14 +08:00
    @mylastfire #28 是,淘宝买一块 2080ti 魔改 22G, 大概 2500 元,就能跑 14B 模型
    em70
        34
    em70  
       2023-12-12 14:11:18 +08:00
    @kkhaike #29 知识库搭起来容易,但真的要工作,需要花大量时间做数据对齐和调试 prompt,做一个好产品从来都不是容易的事
    znonymous
        35
    znonymous  
       2023-12-12 15:18:49 +08:00
    vacuitym
        36
    vacuitym  
       2023-12-12 15:22:15 +08:00
    这个 openai 的 assistant 很适合啊,专门有个根据文档回答问题的,我有对接,你可以试下: https://chat.vacuity.me/
    jmljava
        37
    jmljava  
       2023-12-12 15:31:33 +08:00
    大模型加向量化考虑一下,特定内容向量化问答,通用问题大模型生成
    TimePPT
        39
    TimePPT  
    PRO
       2023-12-12 15:47:56 +08:00   2
    RAG 检索 / ES 检索,得出 TopN 结果,输出给 GPT ,然后再融合生成最终结果。
    效果关键:
    1. 语料预处理要好,本身的结构清晰、不重不漏。
    2. Prompt 约束完整,写清楚目标,链路,给出正例。并对 badcase 情况明确说 Don't Do It!
    lingxmo
        40
    lingxmo  
       2023-12-12 15:55:56 +08:00
    @em70 7900xtx 可以吗♂
    laminux29
        41
    laminux29  
       2023-12-12 17:20:36 +08:00
    楼上那些人都没认真看要求吗?

    楼主说了,不希望用公共的 AI ,因为担心公司数据外泄。

    这种情况只能选不联网的私有化部署的开源大模型才行。
    blessu
        42
    blessu  
       2023-12-12 20:36:59 +08:00
    微软云的 openai service 不知道能不能用,可以的话就从服务合同的角度避免外泄
    em70
        43
    em70  
       2023-12-12 20:58:58 +08:00
    @lingxmo #40 只有英伟达不折腾,其他 GPU 也行,就是问题多,得花时间去调试解决
    clemente
        44
    clemente  
       2023-12-12 23:05:37 +08:00
    LLAMA2 完事了
    hui9000
        45
    hui9000  
    OP
       2023-12-13 09:08:46 +08:00
    @TimePPT 请问这种的话会有本地数据外泄的风险么
    Dav1s
        46
    Dav1s  
       2023-12-13 10:25:45 +08:00
    借贴问问 像这种需求 oa 中大量各种格式文档应该如何处理?
    TimePPT
        47
    TimePPT  
    PRO
       2023-12-13 10:37:06 +08:00   1
    @hui9000 如果直接调取 GPT ,有一定安全合规风险,要求不是很高可以考虑 RAG 完的结果做下脱敏再扔给 GPT ,回复结果里再把脱敏信息还原。
    如果安全合规要求很高,保险期间用私有化部署的开源模型也行,可以找下魔改过的对中文友好的 llama2 ,或者国产可以看下 Yi / Baichuan 之类的
    TimePPT
        48
    TimePPT  
    PRO
       2023-12-13 10:39:42 +08:00
    @crazychang 格式文档预处理有一些开源框架能做,比如 PDF 、Excel 之类的解析,不过如果长期方案,建议做下归一化处理成结构、半结构化的统一格式做索引比如 Markdown or json ,这样有其他诉求,上 DB 也方便
    大模型自己去解析封装好的格式文档基本不靠谱,GPT 之类的应该也是做了前置解析处理的
    blackbookbj277
        49
    blackbookbj277  
       2023-12-13 14:07:52 +08:00
    关注下,同样需求不联网的私有化部署的开源大模型的问答系统,单位工作需要大量的法律、规章制度等内容,如果能不联互联网情况下部署最好了,私有云有 GPU 资源是不是可以用。
    hui9000
        50
    hui9000  
    OP
       2023-12-13 14:56:15 +08:00
    @blackbookbj277 我稍微研究了几天,也结合了大家的建议,你跟我的需求大致差不多,对于内部知识资料等可以用开源模型搞就行,类似知识库这种上面有;
    问答还是交给 chatGPT ;结合两者可以构建应用,也就是所说的基于 api 构建问答系统;
    我现在在研究 https://docs.dify.ai/v/zh-hans/getting-started/readme 这个
    LDa
        52
    LDa  
       2023-12-14 10:27:25 +08:00
    建议推掉这种活,不要高看公司能给你的数据质量
    smalltong02
        53
    smalltong02  
       2024-01-26 08:02:42 +08:00
    可以试试这个开源项目: https://github.com/smalltong02/keras-llm-robot
    wwhc
        54
    wwhc  
       2024-02-11 09:13:35 +08:00   1
    不是应该用类似 github.com/imartinez/privateGPT 之类的开源项目么?
    guozozo
        55
    guozozo  
       2024-03-01 17:35:13 +08:00
    @hui9000 #50 效果如何?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     2985 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 28ms UTC 00:29 PVG 08:29 LAX 17:29 JFK 20:29
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86