
最近在研究图片文字识别,贵族老爷们有没有什么好使的库推荐一发啊,试着用了用 pytesseract,感觉识别效果太差了
1 mashiro233 2018-05-28 09:50:40 +08:00 tesseract-ocr 需要自己训练样本准确度才会高。 |
2 dassh 2018-05-28 10:13:53 +08:00 baidu ocr 接口,最近一直用这个,5W 次 /天免费? |
8 dassh 2018-05-28 11:59:05 +08:00 @sunsulei 嗯嗯,之前还做进对比: ![]() 百度的黄色的正确是中英标点有误(中文的识别成英文),绿色正确是完全正确,单个标红是除了红色部分其它全部识别正确 阿里的就是直接的识别结果 可以看出来百度在文字识别这块还是很强的 |
9 FreeBSD 2018-05-28 12:34:59 +08:00 @dassh 类似 tesseract 的 psm 7 Page segmentation modes: 0 Orientation and script detection (OSD) only. 1 Automatic page segmentation with OSD. 2 Automatic page segmentation, but no OSD, or OCR. 3 Fully automatic page segmentation, but no OSD. (Default) 4 Assume a single column of text of variable sizes. 5 Assume a single uniform block of vertically aligned text. 6 Assume a single uniform block of text. 7 Treat the image as a single text line. |
10 RicardoScofileld OP @mashiro233 我是直接下载的对应的中文训练集,就是不知道自己训练的话要如何实现呢? |
11 RicardoScofileld OP @dassh 大佬发个链接 0.0 |
12 dassh 2018-05-28 13:59:35 +08:00 |
13 RicardoScofileld OP @dassh 谢谢啦 |
14 RicardoScofileld OP @dassh 靠 效果确实不错 就是只有 500 次 |
15 dassh 2018-05-28 14:15:18 +08:00 @RicardoScofileld 通用识别(非高精度)应该有 5W 的,也够用 |
16 night98 2018-05-28 14:19:13 +08:00 via Android ocr 腾讯家最强 |
17 RicardoScofileld OP @dassh 通用的只有 500 次啊,要是 5w 次的话,我就不用再找了 |
18 RicardoScofileld OP @dassh 靠,控制台进去 5w 次,外面 500 次,醉了 |
19 chenuu 2018-05-28 15:42:29 +08:00 我买的谷歌云提供的 vision |
20 RicardoScofileld OP @chenuu 效果和费用怎么样 |
21 lonelygo 2018-05-28 16:32:30 +08:00 公网的话,用免费的 ocr 接口,不是特殊需求日常食用足以。 要内网使用,特殊的字符需求,数据集小的 [tesseract]( https://github.com/tesseract-ocr/tesseract) 3.05 训练好了。 数据集量够的话,可以看看深度学习的方法了:注意力+长短期记忆。 |
22 herozhang 2018-05-28 16:46:13 +08:00 tesseract-ocr 我这边用效果不错,据说 4.x 会更好。 有个前提,图片扔给 ocr 之前需要做一些预处理,例如裁剪、对齐、颜色调整什么的,这样识别率才 ok。 |
23 JCZ2MkKb5S8ZX9pq 2018-05-28 17:07:15 +08:00 之前搞直播答题外挂用的百度 |
24 RicardoScofileld OP @herozhang 请问有具体的 demo 吗,我试着用 PIL 处理,有时候处理后的效果比处理之前的好,有时候处理之后反而更不好了 |
25 LaFayette 2018-05-28 17:23:10 +08:00 tesseract-ocr 0.4 的中文识别效果好点, 我之前做的时候采用 ctpn 算法从文章把文字一行一行抠出来, 在送去识别, 经验证百度的效果更好. [:捂脸] |
26 chenuu 2018-05-28 17:41:40 +08:00 @RicardoScofileld 很便宜,月 1000 条免费,超出后每 1000 条 1.5 美元.效果不好说,没用过其他家的产品,除了手写的,其他的用谷歌很满意 |
27 dbow 2018-05-28 17:53:02 +08:00 tesseract-ocr 这东西需要你自己切图 + 标注, 对固定形态的文字其实效果还不错。 |
28 yanzixuan 2018-05-28 17:53:48 +08:00 现在不是用神经网络来玩吗? keras 的 example 了解一下? |
29 hakaei 2018-05-28 22:06:36 +08:00 via iPhone ctpn 可以很好的抠出横向排布的文字,接下来就是分词和识别的事了,但是 ctpn 对非水平文字效果不怎样,我最近也在研究 ocr 算法的问题,需求不能用 api (哎 |
30 RicardoScofileld OP @hakaei 那就只能研究 tesseract 了,我试试对图片做一些预处理,再试试训练一下样本数据看看效果怎么样 |