要求:翻英文和日文的 pdf 小和技籍( 100-1000 )
在 github 找了一源的 pdftranslate 了一天,如下
1.一半的模型用不了,要不提示 api 不要不未知 2.某些描片格式的 pdf 不文字及排版,翻出要么是原文化要么 3.某些文件翻出各及排版不 4.英文率好於日文,日文存在右到左的排排版比理
求靠的工具,可付
![]() | 1 neteroster 80 天前 via Android ![]() https://github.com/NEKOparapa/AiNiee https://github.com/neavo/LinguaGacha (不支持 PDF) 术语表生成: https://github.com/neavo/KeywordGacha 其实感觉起来先从 PDF 提文本再给工具翻比较好,比如 doc2x 之类(不想用也可以自己写脚本扔给 Gemini API ),竖排日文不确定能不能做。不行的话单独处理,用类似 https://github.com/kha-white/manga-ocr 的东西 |
![]() | 2 unclemcz 80 天前 via Android ![]() 商用还是非商用? 如果非商用,ocr 可以参考 v2 之前一个帖子,从微信提取的 ocr 工具,帖子地址忘了,docker 地址是 https://hub.docker.com/r/golangboyme/wxocr ,我试过对日文识别很好。 翻译的话用本地化的 qwen3 就很好。 你可以参考我之前一个项目所使用的 ocr 和翻译相关接口( https://github.com/unclemcz/wodict ),我觉得非商用的情况下,qwen3+wxocr 可以很好解决你的需求。 当然 pdf 这部分需要你自己再处理。 |
![]() | 3 Alexf4 80 天前 - [ MinerU]( https://github.com/opendatalab/MinerU) - [ocrflux ]( https://ocrflux.pdfparser.io/#/) - [PaddleOCR]( https://github.com/PaddlePaddle/PaddleOCR) 还有更直接的 Gemini 2.5 Pro 。 就是你这个一次识别的页数需要控制好。 |
![]() | 4 Unmurphy 80 天前 最近也在类似需求,同时也看过 pdfmathtranslate ,目前新出的 2.0 版本感觉小问题还是蛮多的, |
![]() | 5 Unmurphy 80 天前 pdfmathtranslate 有点比较好的,注重排版,但对于扫描件支持不是很好,另外表格提取翻译也不是很好 |
![]() | 7 djv 80 天前 via Android OCR 有 UMI-OCR ,翻译有沉浸式翻译 |
8 elinktek OP 大家提供思路信息先一下各位的方法! |