OCR 如何准确识别字母和数字的组合? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
woshichuanqilz
V2EX    问与答

OCR 如何准确识别字母和数字的组合?

  •  
  •   woshichuanqilz 2017-05-21 23:56:35 +08:00 5175 次点击
    这是一个创建于 3064 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如我这幅图识别就比较困难各位有什么办法吗?

    0521235755.png

    6 条回复    2017-05-22 11:53:08 +08:00
    LuckCode
        1
    LuckCode  
       2017-05-21 23:59:43 +08:00 via iPhone
    添加白名单?或是叠加一个移位的图层?
    fffflyfish
        2
    fffflyfish  
       2017-05-22 00:04:49 +08:00 via iPhone
    图像的连通域分析可以识别
    eastpiger
        3
    eastpiger  
       2017-05-22 00:04:55 +08:00
    大一的时候做过一个 OCR 相关的项目,只能算入门的渣渣。。。。

    有一些办法,最粗暴的莫过于找大量的数据扔 CNN,有一种杀鸡用牛刀的感觉,当然数据量足够大的话确实是有效果的,我们当时做的车牌的识别就是这么做的。

    第二类方法就是传统 OCR 的一些形式,如果能确定这个数字的变化不是很多的话,可以在 x 和 y 轴,甚至斜对角求一下积累量,根据这个数据来进行区分,这种算法 naive 得很但是对于字母数字还算是比较有效地(对中文就是废了。。)
    wheeler
        4
    wheeler  
       2017-05-22 00:24:24 +08:00   1
    这种没有粘连的字符还是比较好识别的,不知道题主是想自己造轮子还是单纯的求解决方案。

    就这种图而言,可以 label 后,求 bounding box 把字符分割出来。
    如果字符本身不是很复杂的话(比如噪声,倾斜什么的),直接用模板匹配就可以了。

    如果只是求解决方案的话,类似于 tesseract ( https://github.com/tesseract-ocr/ )的 OCR 很多啊,还可以针对自己的样本集训练。
    KaoN
        5
    KaoN  
       2017-05-22 06:56:23 +08:00 via iPhone
    正在集成一个 ocr 项目,字母+数字..正如三楼所说..扔给 cnn...
    WayToPlay
        6
    WayToPlay  
       2017-05-22 11:53:08 +08:00
    @wheeler tesseract 这么多年了,其实没啥改进,英文和数字还好点,中文识别慢的要死,准确率也低.
    这些都不算啥,关键是容易 Native crash.
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5555 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 32ms UTC 08:51 PVG 16:51 LAX 01:51 JFK 04:51
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86