V2EX ryanwong97 的所有回复 第 1 页 / 共 1 页
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX    ryanwong97    全部回复第 1 页 / 共 1 页
回复总数  5
@ccloving 目前我了解的情况,二开开源框架的确实比较多,一般徒手从零开始搭的,要么是技术背景特别雄厚的超大规模团队,要么是规模特别小要求也不是很高的小型团队。我看国内很多国企和中大型企业都在二开开源框架。国外的话自研的比例很大,有个在花旗银行的朋友,去年他们的 RAG 还是在用 langchain 从零搭建。作为对比,我看到很多国内地区性银行(头部大行不谈)都在用开源框架。
正在搞这块,可以简单回答下。

首先 anythingLLM 这个是娱乐级的,个人玩玩可以,用在企业级不合适。

目前企业搞知识库,基本上就 2 个途径,第一个是自己从零开始撸,这个也没有想象得难,比较 langchain 和 llamaindex 把玩法已经早就放出来了。当然目前的显著趋势是去 langchain 化。第二个就是基于目前现有的开源框架,比如 dify 、ragflow 、bisheng 等。这种的优势是不用从零开始,上手会很快,如果要求不高甚至是开箱即用;弊端是如果需求比较个性化,那么二开是难免的。也就很考验开发团队的工程能力了。

当然,这些都是工具,企业搞知识库,很重要的一点是你的私有数据到底已经整理得怎么样了。很多传统企业或者传统业务部门,数字化都还没完全实现,信息传递还在重度依赖纸张和萝卜章,想越过数字化直接拥抱 AI 化,基本上是痴人说梦。凑个热闹写个通稿可以,但实际效果只能说冷热自知。
@yb2313 除了文档解析比较好,其他都比较一般。不过文档解析是 RAG 的重要一环,不少业务场景对这块要求挺高。
@hwangyi 之前大致算了一下 kimi 的 API 接入方式的使用费用。moonshot-128k 现在的价格,是 6 分钱每千 token ,按照 50 人规模团队测算,假设每人每天对话 20 轮,一个月下来(就工作日 22 天)的话,费用接近一张 4090 的钱。
跟 LZ 类似的需求,现在主力在用 Dify ,同时还在备选观望 Bisheng 和 RAGFlow ,这俩还没部署,实际功能和体验尚不明确。

目前的主力解决方案是:框架用 Dify ,主要选择理由是完成度高,开箱即用。LLM 本地部署了 Qwen1.5-14b (基本上目前国产开源 10b 级别里面中文对话场景最强),也有 API 接入方式的 LLM ,比如 moonshot 。对智谱、百川和 yi 在实际任务中的表现比较失望。为了 RAG 任务本地还部了 embedding 模型和 rerank 模型。

知识库功能那块,Dify 目前的能力勉强算“能用”,自动分块基本上都是切稀碎,想要召回命中效果好,重新编辑 chunk 是必须的。而且对复杂文档的解析非常一般,这也是目前在看 RAGFlow 的原因(文档解析功能很牛,但整体框架的完成度太低)。

我这边的需求不仅仅是企业私有知识库,还需要对接企业数据库( MySQL )以实现 Chat to DB 的功能,目前还在研究解决方案摸索中。如果大家有合适的解决方案,也请推荐一下。
关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     1111 人在线   最高记录 6679       Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 12ms UTC 23:12 PVG 07:12 LAX 16:12 JFK 19:12
Do have faith in what you're doing.
ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86