![]() | 1 iv8d 133 天前 ![]() ollama |
![]() | 2 murmur 133 天前 200 个产品本地部署你得几套 deepseek 才够用哦 |
![]() | 3 coefu 133 天前 很拉,没效果的。 |
4 dualist 133 天前 ![]() 你要做的是把知识库的每个文件元数据提取出来,然后存到 db 或者非关系数据库,暴露个接口参数让 AI 调用搜索结果,解析结果返回数据就行而不是全部喂给 AI |
5 zxcvbnm001 133 天前 via iPhone ![]() 可以选择 rag ,目前看微调还是不如 rag 稳定 |
![]() | 6 luny 133 天前 ![]() ollama+dify |
7 444571840 132 天前 本地 AI 不是特别推荐,当玩具玩玩可以,生产力就算了 |
10 YsHaNg 131 天前 via iPhone ![]() @murmur pcie 槽够多就行 200 也不是很大 多插点卡完事 这里也没什么并发需求 重要的是权重+上下文能塞进显存里 r1 模型卡 128k 属实不适合干这种事 实际召回率更低 |
![]() | 11 happybabys 130 天前 ![]() 模型没有最强的,只有最适合的,本地部署是正确的选择 |