




1 Doraemontree 271 天前 是不是繁体的不好识别 |
2 ShenZhen 271 天前 综合哪个好用? |
4 docx 271 天前 via iPhone 如果是简体呢 |
6 ha1o 271 天前 想问下,假设识别率 100%,后续是要把原字幕完全替换一遍生成新字幕吗?那岂不是要输入加载原字幕的视频? |
7 SakuraYuki 271 天前 |
8 pxiphx891 OP @SakuraYuki 这是什么软件? |
10 BluePadge 271 天前 |
11 PRStarDust 271 天前 试了一下 RapidOCR-API ,直接跳过了繁体哈哈哈 ```json { "0": { "dt_boxes": [ [ 206, 354 ], [ 513, 355 ], [ 513, 392 ], [ 206, 390 ] ], "rec_txt": "那我无论如何", "score": "0.9971" }, "1": { "dt_boxes": [ [ 228, 394 ], [ 490, 394 ], [ 490, 430 ], [ 228, 430 ] ], "rec_txt": "都要试一下", "score": "0.9877" } } ``` |
12 rqYzyAced2NbD8fw 271 天前 要不是现在的 vision llm 无法返回每个字的坐标,传统 OCR 估计直接被淘汰了 因为就算是人眼,识别文字也要靠上下文。比方说有些人可能会把看成葡萄。但是如果我说,“我要用插你屁眼”,那这两个字是什么一眼就明白了 |
13 icemaple 271 天前 一直在用 abbyy |
14 SakuraYuki 271 天前 @pxiphx891 #8 bob ,调用自带的 ocr 接口 |
15 Mar5 271 天前 现在 OCR 我都丢给 Gemini ,我儿子小学 5 年级,字很差的 400 字作文 OCR 就错了 3 个字 |
16 obeyatonce 269 天前 api 调用百度高精度 ocr 的识别结果:那麽我无论如何都要嘈试一下 |
17 zggsong 269 天前 |
18 lozzow 268 天前 可以尝试拆字后识别再重新合并,会有包不错的提升 |
20 zggsong 266 天前 via iPhone |