玩转个人知识库! Paperless-ngx 增强版: VLM 视觉识别、无限树形目录、Chat with Doc 文档对话 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
510908220
0.02D
V2EX    分享创造

玩转个人知识库! Paperless-ngx 增强版: VLM 视觉识别、无限树形目录、Chat with Doc 文档对话

  •  
  •   510908220
    CallStorm 7 天前 1747 次点击

    大家好,

    相信很多 V 友都有管理发票、说明书、合同和旧纸质文件的烦恼。Paperless-ngx 是目前开源界强大的文档管理系统,支持 OCR 、自动打标签和全文搜索。

    但是官方原版在实际部署中(尤其是中文环境下)可能会遇到一些门槛以及 AI 功能支持不足。所以我维护了一个优化版本:CallStorm/paperless-ngx

    相比原版,这个 Fork 解决了什么?

    我主要针对中文环境和智能化做了以下核心增强:

    1. 真正的“看图说话” (VLM 视觉模型)

    原版 Tesseract OCR 面对手机随手拍的歪歪扭扭的票据、皱巴巴的纸张,识别率往往惨不忍睹。

    • 增强后:引入了 VLM (视觉模型)。它不是死板地识别字符,而是像人眼一样“理解”图片。
    • 效果:哪怕照片光线不好、有折痕,它也能精准提取出“发票金额”、“保修日期”等关键信息。

    2. 支持无限级“树形目录”

    原版 Paperless 强推“标签( Tag )”逻辑,但对于很多习惯 Windows 资源管理器一层层文件夹分类的朋友来说,非常反直觉。

    • 增强后:实现了直观的树形目录体系。你可以像在电脑上一样创建无限层级的文件夹,文件上传到目录后会自动继承标签,既有目录的结构,又有标签的灵活。

    3. 文档对话 (Chat with Doc)

    文档存进去不再是死数据。

    • 增强后:集成 LLM 。你可以在文档详情页直接问它:“这份保险合同涵盖哪些大病?”、“这个宽带什么时候到期?”,它会基于文档内容回答你,不用自己去翻几千字的小字条款。

    4. 优化部署

    • 预置了中文 OCR 语言包配置,解决了原版常见的中文乱码或识别率低的问题。
    • 优化了 Dockerfile 镜像开箱即用,省去了繁琐的环境配置。

    截图预览

    后续计划

    目前的版本已经可以稳定满足日常归档需求。后续计划加入语义搜索(不再依赖关键词,搜意思也能搜到)和全局 AI 助手。

    希望能帮到同样有收纳强迫症、或者喜欢折腾 NAS 的朋友、或者喜欢打造自己的知识库的人。 如果有 Bug 或建议,欢迎在 GitHub 提 Issue 或 PR ,感谢!

    传送门:https://github.com/CallStorm/paperless-ngx


    TeslaM3
        1
    TeslaM3  
       6 天前
    总之,很牛逼的开源。
    关于     帮助文档     自助推广系统   博客     API     FAQ     Solana     2795 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 14:13 PVG 22:13 LAX 06:13 JFK 09:13
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86