大佬们,求助本地部署大模型 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
jjyyryxdxhpyy
V2EX    Local LLM

大佬们,求助本地部署大模型

  •  1
     
  •   jjyyryxdxhpyy 2024-04-02 08:42:55 +08:00 7685 次点击
    这是一个创建于 623 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有下面几个要求:

    1 、本地部署开源的大模型

    2 、有知识库管理

    3 、可提供接口

    有没有满足的产品呀

    39 条回复    2024-12-12 16:38:34 +08:00
    2kCS5c0b0ITXE5k2
        1
    2kCS5c0b0ITXE5k2  
       2024-04-02 08:53:30 +08:00
    ollama AnythingLLM
    9dP06m83vIV00l72
        2
    9dP06m83vIV00l72  
       2024-04-02 09:01:22 +08:00
    NoobNoob030
        3
    NoobNoob030  
       2024-04-02 09:03:16 +08:00
    1. 大模型单独部署,huggingface 或者魔搭社区看看文档就能部署
    2. 知识库管理+接口这种 AI 平台,想傻瓜式开箱即用的,国内推荐 fastgpt ,国外推荐 langflow 。想自己开发就用 langchain
    jjyyryxdxhpyy
        4
    jjyyryxdxhpyy  
    OP
       2024-04-02 09:04:25 +08:00
    @NoobNoob030 谢谢
    jjyyryxdxhpyy
        5
    jjyyryxdxhpyy  
    OP
       2024-04-02 09:04:36 +08:00
    @andytao 谢谢,我看看
    jjyyryxdxhpyy
        6
    jjyyryxdxhpyy  
    OP
       2024-04-02 09:04:58 +08:00
    @emeab ollama 我知道,本地部署了,现在在想怎么集成知识库
    9dP06m83vIV00l72
        8
    9dP06m83vIV00l72  
       2024-04-02 09:17:08 +08:00
    楼主考虑的是编程集成吧?

    比如用已有知识库训练模型,调用 API 输出想要的结果等,最好把后续细节细化一下,或许有更多有可行性的建议;
    seeyourface
        9
    seeyourface  
       2024-04-02 09:23:03 +08:00
    同问,通过知识库外部引用和使用知识库作为训练集微调模型,有没有这方便的大佬知道哪种方式的效果更好吗
    jjyyryxdxhpyy
        10
    jjyyryxdxhpyy  
    OP
       2024-04-02 09:28:25 +08:00
    @andytao 是这样,本地部署一个类似 ollama 的服务,集成开源大模型,然后基于这个模型,集成知识库,对面前端来说,可以调用接口,做进一步修改,适配项目
    jjyyryxdxhpyy
        11
    jjyyryxdxhpyy  
    OP
       2024-04-02 09:28:35 +08:00
    @andytao 谢谢,我看看
    Lockeysama
        12
    Lockeysama  
       2024-04-02 09:32:27 +08:00
    本地模型和其它可以分开的话,可以试试 https://github.com/langgenius/dify
    支持接入本地模型
    tricker1215
        13
    tricker1215  
       2024-04-02 09:51:42 +08:00
    话说有没那些本地“小模型”。
    基于特定的文本内容做成一个问答机器人,文本内容短,但是准确性要求高。
    fredweili
        14
    fredweili  
       2024-04-02 10:00:40 +08:00
    hugging face 去找找
    jjyyryxdxhpyy
        15
    jjyyryxdxhpyy  
    OP
       2024-04-02 10:10:03 +08:00
    @fredweili 太难找了
    jjyyryxdxhpyy
        16
    jjyyryxdxhpyy  
    OP
       2024-04-02 10:10:23 +08:00
    @tricker1215 这不就是,和我要求差不多,本地部署,需要集成知识库
    jjyyryxdxhpyy
        17
    jjyyryxdxhpyy  
    OP
       2024-04-02 10:10:42 +08:00
    @Lockeysama 可以
    NewHere
        18
    NewHere  
       2024-04-02 10:26:09 +08:00
    英伟达的 Chat with RTX 呢,那个好像是分析本地文件的
    kuqma98
        19
    kuqma98  
       2024-04-02 10:36:50 +08:00
    Langchain-chatchat
    supergeek1
        20
    supergeek1  
       2024-04-02 11:00:46 +08:00
    https://github.com/chatchat-space/Langchain-Chatchat
    这个应该完全符合你的要求,支持本地模型、知识库管理问答、API 页面都有
    jjyyryxdxhpyy
        21
    jjyyryxdxhpyy  
    OP
       2024-04-02 11:13:34 +08:00
    @supergeek1 可以可以,感谢
    jjyyryxdxhpyy
        22
    jjyyryxdxhpyy  
    OP
       2024-04-02 11:14:04 +08:00
    @kuqma98 感谢
    supergeek1
        23
    supergeek1  
       2024-04-02 11:42:12 +08:00
    @jjyyryxdxhpyy #21 不过这个项目的代码感觉有点杂了(好像也快出 0.3 版本了),如果会开发的话你的需求用 langchain+fastapi 搞一搞也很快能实现
    wwhc
        24
    wwhc  
       2024-04-02 12:00:53 +08:00
    echoyangjx
        25
    echoyangjx  
       2024-04-02 12:37:04 +08:00
    网易有道这个满足你的需求,https://qanything.ai/
    Adelell
        26
    Adelell  
       2024-04-02 12:43:25 +08:00 via iPhone
    jackrebel
        27
    jackrebel  
       2024-04-02 12:47:41 +08:00
    留眼学习
    jjyyryxdxhpyy
        28
    jjyyryxdxhpyy  
    OP
       2024-04-02 13:03:21 +08:00
    @wwhc 收到
    isquare
        29
    isquare  
       2024-04-02 15:30:11 +08:00   1
    fastgpt 比较符合你的需求,dify 我也用过,但是好像外国人做的土不服。再一个它支持可视化的高级编排 workflow ,上手比较容易,很方便快速搭建。

    1. 本地部署开源大模型,这一点跟知识库本身没关系,你自己随便部署

    2. 知识库,fastgpt 我觉得做的比较好,它比较早使用 QA 问答对儿的模式去构建知识库,后来其他框架比如 dify 也抄了这个模式

    3. fastgpt 的知识库接口兼容 openai 接口的调用,也有自己的格式(用 chatid 存储对话历史之类的),调用比较方便
    jjyyryxdxhpyy
        30
    jjyyryxdxhpyy  
    OP
       2024-04-02 15:36:53 +08:00
    @isquare 非常感谢
    charexcalibur
        31
    charexcalibur  
       2024-04-02 17:40:23 +08:00
    ollama dify
    yukYaoT
        32
    yukYaoT  
       2024-04-02 18:31:14 +08:00
    fastGPT 吧,今天我们也在部署这个
    Jat001
        33
    Jat001  
       2024-04-02 19:09:16 +08:00
    @isquare #29 dify 都有中文文档,怎么可能是外国人做的,苏州的公司,去年创建的
    7VO54YYGvw3LOF9U
        34
    7VO54YYGvw3LOF9U  
       2024-04-02 20:11:09 +08:00 via iPhone
    一直不太懂如果本地部署大模型不是为了商用,有什么意义
    jjyyryxdxhpyy
        35
    jjyyryxdxhpyy  
    OP
       2024-04-03 08:34:12 +08:00
    @hugi 有些内网环境
    jjyyryxdxhpyy
        36
    jjyyryxdxhpyy  
    OP
       2024-04-03 08:34:26 +08:00
    @yukYaoT 可以
    conglovely
        37
    conglovely  
       2024-04-03 09:01:02 +08:00
    我用 ChatGLM3 + Langchain-chatchat 搭起来了
    拯救者 4060 8G 显存跑满,还借用了点内存 模型要能再精简点就好了
    isquare
        38
    isquare  
       2024-04-03 10:07:29 +08:00
    @Jat001 #33 我描述的是我主观感觉,“好像外国人做的”,体验一般的意思
    skykk1op
        39
    skykk1op  
       2024-12-12 16:38:34 +08:00
    大佬,参考下方案。我现在也有类似的需求
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     921 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 22:19 PVG 06:19 LAX 14:19 JFK 17:19
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86