已更新支持手机浏览器进行ocr,并优化大PDF处理过程
![]() | 1 justincnn 2023-06-12 17:47:16 +08:00 准确率很高,支持 pdf 转 excel 么? |
3 EmpCold 2023-06-12 17:51:23 +08:00 |
![]() | 5 itxh 2023-06-12 17:54:55 +08:00 已收录到 https://www.wangdu.site/software/566.html ,希望对你有所帮助 |
![]() | 8 kebamt 2023-06-12 18:35:04 +08:00 稍微复杂的就处理不了,而且太慢了 |
![]() | 10 itechify PRO 支持直接粘贴吗? |
![]() | 11 itechify PRO @oneisall8955 不好意思,没看到下面的小技巧 |
![]() | 12 fox 2023-06-12 20:33:43 +08:00 支持一下,蛮好 |
13 vueli 2023-06-13 09:16:11 +08:00 我记得之前有个事情,说什么 orc 的问题坐牢的。具体什么东西我忘记了,楼主留个心眼 |
![]() | 16 b4115Z4mRAz9P8EA 2023-06-13 10:00:47 +08:00 非常好,请教一下,ocr 有办法识别相应文字的字体、字体大小、粗细、颜色这些信息吗? |
![]() | 17 subframe75361 2023-06-13 10:09:37 +08:00 可以支持一下 pwa 吗 |
![]() | 18 subframe75361 2023-06-13 10:11:26 +08:00 非常好用 |
![]() | 20 dassh OP @subframe75361 感谢支持,近期可能不会弄 pwa ,因为不太懂这块,目前的最优先的是使用多 worker 加速识别速度、尝试支持手机浏览器,后续弄完我学学看。 |
![]() | 21 yuanchao 2023-06-13 11:11:13 +08:00 如果要支持表格提取识别,可以弄吗 |
![]() | 22 fakecoder 2023-06-13 11:12:06 +08:00 优秀! |
![]() | 24 b4115Z4mRAz9P8EA 2023-06-13 11:33:14 +08:00 @dassh 没关系,我也一直没找到 |
25 monkey110 2023-06-13 11:38:20 +08:00 via Android @vueli shuax 作者用自己开发的软件 ocr 群里裸,贷链接然后又发到群里的这事吧 主打一个分享 |
26 hteen 2023-06-13 16:00:58 +08:00 |
![]() | 28 RatioPattern 2023-06-13 22:53:20 +08:00 英文效果很好,比 python-docr 和 tesseract 默认都好多了 |
![]() | &nbp; 29 RatioPattern 2023-06-13 22:57:49 +08:00 没有做任何微调达到的效果吗 |
![]() | 30 dassh OP @RatioPattern 是的 |
31 jzyzcz 2023-06-14 00:01:52 +08:00 速度很快!后面会推出收费模式吗? |
![]() | 32 dassh OP @jzyzcz 关于收费: 短期不考虑,一是做 ocr 的网站太多,又没什么杀手级功能,二是接入支付挺麻烦(没做过),三是用户量没几个,收费都跑了。一开始想法是接入 adsense 看能收回服务器成本不,但 adsense 不给新站过,先等等 关于速度: 目前都是单线程预测的,计划增加配置使用多线程预测,配置越多,速度越快,当然你 cpu 和内存也占用越多 近期规划: 1. 网站是 23 年 5 月 21 日上线的,google search console 配置了,但 ocr 网站太多,搜索 online ocr 前 8 页都找不到(没有第 9 页,只有 8 页),我有在后台统计 ocr 的图片数量、pdf 页数(也仅限于此),在 v2 发这贴之前,这个数字基本每天都是 0 ,所以我得学学怎么宣传,seo ,做外链这些 2. 上面提到的速度优化 3. 注意到有人尝试了 ocr 一个几百页的 pdf ,一本书?我也试了下,直接快卡死一段时间,后面在预测第二页时崩了,分析了下当前是用同步的方法将所有图片加载到内存,所以一次性加载几百张图片撑不住,不知道这个是不是强需求,我会尝试解决 |
33 kangyangqishi 2023-06-14 09:38:36 +08:00 |
![]() | 34 LavaC 2023-06-14 10:30:44 +08:00 好奇问一下 op ,如果想做一个适配异型字体(异型到看不出是什么)的 ocr 工具,也可以应用你这套开发流程吗? 只需要识别 26 个英文字母就好了。 |
![]() | 35 dassh OP @LavaC 可以的,“异型到看不出是原字母”的话,就需要单独训练一个识别模型,只有 26 个字母的话大概 10k 的训练样本吧(经验之谈)。 然后针对你说的:“我这套开发流程”,可能并不适用,因为这个网站是针对通用 web 场景的,然后为了省服务器成本,把预测步骤放到了端侧,开发时间全耗在这里面( onnx ,web worker, opencvjs )。你可能更需要的是只是一个 restful 接口,有基础的可以看看 PaddleOCR 文档 |
![]() | 37 92Developer 2023-09-19 23:34:28 +08:00 via Android |
![]() | 38 lynzya 191 天前 |