immich 重磅更新 OCR - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
fuchaofather
V2EX    NAS

immich 重磅更新 OCR

  •  
  •   fuchaofather 6 小时 15 分钟前 1994 次点击

    immich 最新 release开始正式支持 OCR ,当前近乎已经是相册管理的完全体了。

    分享下我的硬件:

    • OES (¥ 99 )部署immich_server,immich_postgres
    • OECT(¥ 80)部署immich_machine_learning 可以用到 rk3566 的 npu 加速
    22 条回复    2025-10-31 15:55:53 +08:00
    unhappy224
        1
    unhappy224  
       6 小时 7 分钟前
    我想问问这套硬件跑起来会有性能问题吗?例如新导入几千张照片这样,扫描要多久?
    如果买好点的 n150 甚至是 7840 那一堆,会快多少?
    kuanos
        2
    kuanos  
       5 小时 55 分钟前
    immich 在 qnap 上每次布置都失败,很绝望啊
    Aprdec
        3
    Aprdec  
       5 小时 45 分钟前
    immich app 一次上传几百张 有 bug
    fuchaofather
        4
    fuchaofather  
    OP
       5 小时 44 分钟前
    @unhappy224 跟你选的模型也有关系,可以参考(官方文档)[https://docs.immich.app/features/searching]根据你的配置(内存、ARM 、CUDA 还是 RKNN )选择合适的模型。我的 oect 是 RKNN+4G 内存所以选择了`ViT-B-16-SigLIP-i18n-256__webli`,图片识别大概 1 秒 3-4 张的样子,OCR 因为 CPU 比较孱弱 6 秒一张
    mooyo
        5
    mooyo  
       5 小时 41 分钟前
    一更新就挂了。。
    [Nest] 6 - 10/31/2025, 10:33:29 AM LOG [Microservices:WebsocketRepository] Initialized websocket server

    Error: getaddrinfo EAI_AGAIN database

    at GetAddrInfoReqWrap.onlookupall [as oncomplete] (node:dns:122:26) {

    errno: -3001,

    code: 'EAI_AGAIN',

    syscall: 'getaddrinfo',

    hostname: 'database'

    }

    microservices worker error: Error: getaddrinfo EAI_AGAIN database, stack: Error: getaddrinfo EAI_AGAIN database

    at GetAddrInfoReqWrap.onlookupall [as oncomplete] (node:dns:122:26)

    microservices worker exited with code 1

    Killing api process

    没看到 release 上写了啥 breaking changes 啊。。
    fuchaofather
        6
    fuchaofather  
    OP
       5 小时 15 分钟前
    @mooyo 你是哪个版本上来的啊,我每个版本都在跟没啥问题
    mooyo
        7
    mooyo  
       5 小时 12 分钟前
    @fuchaofather #6 解决了。。看了下日志,是我的 pg 数据库启动的时候发现没空间,没拉起来。

    没空间的原因是我的这个虚拟机(跑在 mac mini 上的)只分配了 30G 空间( photo 是网络挂载的),我以为够了,其实已经被 docker 镜像塞满了。。
    lu5je0
        8
    lu5je0  
       5 小时 1 分钟前
    还差个 ultra HDR
    mogita
        9
    mogita  
       4 小时 45 分钟前
    同在 OECT 上运行,五千多照片视频,简直游刃有余。
    mooyo
        10
    mooyo  
       4 小时 39 分钟前
    mac mini 上有办法搞到硬件加速么?跑 docker 上看起来 OCR 性能不太行
    NoDataNoBB
        11
    NoDataNoBB  
       4 小时 0 分钟前
    有支持中文地图的方案吗
    faketemp
        12
    faketemp  
       3 小时 52 分钟前 via iPhone
    immich 虽好部署维护太难了 一不小心各种报错 gpu 核显调用也各种配置各种问题 折腾几次都很难完美跑起来 等有一键整合版再研究
    SenLief
        13
    SenLief  
       3 小时 27 分钟前 via iPhone
    @NoDataNoBB 图源应该没办法改吧,只能把城市这些改为中文。
    chenluo0429
        14
    chenluo0429  
       2 小时 57 分钟前 via Android
    ocr 是真的慢,从早上开始的任务,15000 的资源 3 个并发,现在还有 1000+没跑完
    fuchaofather
        15
    fuchaofather  
    OP
       2 小时 53 分钟前
    @mooyo #10 我试过,有难度。你可以去 discuss 里找找看
    mooyo
        16
    mooyo  
       2 小时 36 分钟前
    @fuchaofather #15 感谢指引,看到了。

    思路是单独运行 machine-learning-svr 到一个支持 ml 的环境(裸环境直连 gpu ,tpu )。

    这个思路适用于存算分离的场景
    Xiaosteven
        17
    Xiaosteven  
       1 小时 43 分钟前
    我用 3090 的训练 ocr 真的慢,10 个并发直接干重启,改成 3 个并发,平均 10 秒 3 个...
    zhucegeqiu
        18
    zhucegeqiu  
       1 小时 36 分钟前   1
    sky300
        19
    sky300  
       1 小时 32 分钟前
    实在折腾不起了 直接入了个 MTPhotos ,省心了。
    rfrftt
        20
    rfrftt  
       1 小时 22 分钟前
    ocr j4125 上 nllb-clip-large-siglip__v1 模型, 差不多 20s 处理一张图
    Jasonqiao
        21
    Jasonqiao  
       1 小时 19 分钟前
    原来 OCR 这么吃性能么,以为是一个基础功能呢
    dobelee
        22
    dobelee  
       19 分钟前
    没有 NPU 的群晖能跑吗?
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5118 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 08:15 PVG 16:15 LAX 01:15 JFK 04:15
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86