大量的 HTML 文件需要翻译,用什么方法比较好? - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Jakarta
V2EX    翻译

大量的 HTML 文件需要翻译,用什么方法比较好?

  •  
  •   Jakarta 2022-05-13 20:11:44 +08:00 1894 次点击
    这是一个创建于 1245 天前的主题,其中的信息可能已经有所发展或是发生改变。
    离线的 HTML 文件,大概上百个左右,是英文文档。

    肯定是要先机翻以下,然后再手动调整。

    不知道怎么能比较方便实现?有没有什么现成的工具?
    7 条回复    2023-12-21 08:20:54 +08:00
    renmu123
        1
    renmu123  
       2022-05-13 20:27:15 +08:00 via Android
    用你喜欢的语言找个解析 html 的库,把文字解析出来后找个翻译 api
    TimePPT
        2
    TimePPT  
    PRO
       2022-05-13 20:32:44 +08:00
    大厂机翻的接口都支持网页文档翻译的
    比如百度的: https://fanyi-api.baidu.com/doc/27
    比如阿里云的: https://help.aliyun.com/document_detail/163814.html?spm=a2c4g.11186623.0.0.7b97273fOFEeoO
    wangkun025
        3
    wangkun025  
       2022-05-13 20:42:56 +08:00
    找兼职的学生。
    Chism
        4
    Chism  
       2022-05-13 21:23:30 +08:00 via Android
    @TimePPT
    有没有那种网页里引入.js ,直接就可以对本网页进行翻译的?
    ch2
        5
    ch2  
       2022-05-13 21:42:58 +08:00
    python 很简单,bs4 提取 text ,然后 google 翻译 api 一调用就完事了
    flowerpiggy
        6
    flowerpiggy  
       2022-05-14 00:55:55 +08:00
    用 windows/mac 上可用的 GT4T 吧,不折腾:

    1. 直接翻译文件夹内及子文件夹里所有 html 格式的文件,保留文件夹层次结构,拖文件夹到界面,然后等即可。
    2. 全球 29 个自动翻译引擎任选,什么 deepl, google, modernmt 你知道的不知道的都有。可找一两个文件先试几个引擎选择最优的。
    3. 可使用自己的词汇表来修正自动翻译结果。
    4. csdn 搬家技术供应商,练就一身好本领。
    请自行搜索下 GT4T 。
    bigtang
        7
    bigtang  
       2023-12-21 08:20:54 +08:00
    批量导入 tanglib.com 成一本书, 然后一键整本书翻译
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     5307 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 25ms UTC 07:27 PVG 15:27 LAX 00:27 JFK 03:27
    Do have faith in what you're doing.
    ubao snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86