开发了这样一个翻译 app,大家会用吗? - V2EX
爱意满满的作品展示区。
wbh

开发了这样一个翻译 app,大家会用吗?

  •  
  •   wbh 1 day ago 1005 views

    最近借助 AI 实现了这样一个翻译 App (名字还没想好)。

    开发这个 App 的出发点是这样的。最近在看一本关于 PyTorch 的英文电子书,虽然也能看懂英文,但是效率肯定没有读母语来得高。同时书中的有些内容还不够理解,需要进一步提问澄清。所以我想把翻译和提问合在一起完成。简单找了下市面上的相关工具,发现没有特别称手的。有些 PDF 阅读器虽然能够翻译,但是要么收费,要么无法追问。另外就是这些阅读器的模型和提示词都是固定的,没法自定义(比如我想让用语接近中文习惯,减少机翻感)。

    所以就有了自己开发的想法(这也是 AI 时代的好处吧,只要有想法和 token ,就可以自己实现)

    使用上,你可以正常的输入文本让它翻译,但更好的方式直接把书中的某一页或多页直接截图贴给它。它会自动把图片拼接,同时识别文中的文字,代码,表格甚至插图,然后把翻译后的文字与这些内容重新组合在一起,形成一个排版好的 markdown 的文档,然后渲染出来。

    另外上面说了,App 的定位是辅助阅读,除了翻译以外,你还可以就翻译中的内容直接提问。比如一开始我是用它来学习 PyTorch ,对于书中不理解的地方就直接问它。如果你在别的地方提问,需要把上下文搬过去,但这里由于本来就有上下文,所以 AI 会更好的理解你的问题。

    后来我发现这个 App 对另外我之前看过的一本书《 The Photographer's Eye 》(摄影师之眼)也很有用。这本书的排版上不太寻常,它的一页很宽,在显示器上看着很累。使用这个 App 翻译+重排以后,可看度提升了很多。当然,提问也是很重要的,原书文字有些晦涩,翻译+提问后理解更加准确了。

    如果大家也觉得有用,我就把它再做进一步的 polish ,发布出来。

    或者大家还有什么建议都可以说说。

    7 replies    2026-05-18 16:01:54 +08:00
    niboy
        1
    niboy  
       1 day ago
    我应该是用不着
    1. 如果是 pdf 或网页,直接用沉浸式翻译就行了,不用自己截图发送啊
    2. 如果说要理解内容,文档扔给 IMA ,在 IMA 直接问,或者 cursor 之类的截图问就行
    wbh
        2
    wbh  
    OP
       1 day ago
    @niboy 是的,通过工具组合肯定也是能实现目的的。

    不过我这里是想实现一站式的效果,我想了想,本质上我对它的定位应该是属于阅读辅助,不完全是简单的翻译。我的想法是,一本书你看到哪里,就截几张图丢进去,让它翻译和排版,方便你阅读和理解。然后有问题就提问,之于翻译结果你保不保留,都随你自己。最重要的是你吸收和理解了你所阅读的内容。
    SuperDaniel313
        3
    SuperDaniel313  
       1 day ago
    最近在用 NotebookLM 读一些大部头,有些没译本,摸索出来的方法就要么丢给豆包/IMA 来汉化,同时一份副本塞到 NLM 里,然后边读边问。或者把原文处理成 HTML ,直接用浏览器插件翻译,选择 LLM 的自由度更高。同样也是配合 NLM 来学习。

    综合下来看,LLM 除了编码相关的实践,目前对我来说用处更大的是辅导学习。毫不夸张地说,NLM 堪比 7x24 小时的全领域专家实时解答。

    NLM 背靠 Gemini 多模态,图表、公式、图片,全都能语义化理解,在这个领域还没看到其他能打的出来。
    SayHelloHi
        4
    SayHelloHi  
       1 day ago
    如果是翻译 PDF 的话 可以看看 UPDF 这个软件

    非常棒
    wbh
        5
    wbh  
    OP
       1 day ago
    @SuperDaniel313 NLM 还没用过,我去了解一下
    wbh
        6
    wbh  
    OP
       1 day ago
    @SayHelloHi UPDF 确实不错,之前也是经常用。不过还是 you 我提到的两个问题,一是模型和提示词不能自定义,不能调整翻译风格,有些书籍的文字完全直译的话不容易理解;二就是不能直接提问,如果要问问题,你得换别的 LLM 工具,有时还得把书中的内容复制过去作为上下文,比较麻烦
    SuperDaniel313
        7
    SuperDaniel313  
       1 day ago
    @wbh #5 看了一下你的场景,和我的差不多,只需要解决翻译方面的问题即可。

    和 AI 的交互丢给 NLM 是当前优解。NLM 还可以多文档塞到一个笔记本里,能实现跨领域问答,回答都是基于文档,比普通网页版的附件检索更靠谱。

    NLM 有开源的能代替,https://github.com/lfnovo/open-notebook

    不过都要依赖模型,还是白嫖谷大善人的服务吧,总性价比最高。
    About     Help     Advertise     Blog     API     FAQ     Solana     3022 Online   Highest 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 56ms UTC 13:21 PVG 21:21 LAX 06:21 JFK 09:21
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86