1 leezii 2013-10-15 15:49:02 +08:00 opencc |
![]() | 2 hustlzp 2013-10-15 16:02:17 +08:00 我有一个js转换函数,网上找的,原理很傻很粗暴:2个字符串,一个存繁体字,一个存对应的简体字,然后全局遍历,找到简体字的index,然后根据此index在繁体字符串中找即可... https://gist.github.com/hustlzp/5334819 |
![]() | 4 dorentus 2013-10-15 18:38:35 +08:00 opencc 有命令行或者 python、ruby 什么的库的吧,那么自己写个脚本转就好了…… 不过你确定自动转出来的质量能接受么? |
![]() | 5 alexrezit 2013-10-15 21:08:04 +08:00 纯字符替换是不可以的, 因为有很多词汇上的差异, 不同地区的繁体也是不一样的. |
![]() | 6 vibbow 2013-10-16 18:58:28 +08:00 ![]() 微软有API,个人觉得简繁转换的准确率比Google的高(google的基本就是按字转换,微软的是按词组转换)。 之前实习的时候写过一个类似的东西: 扫描一个目录下所有的语言文件(xml文件,然后判断是不是语言文件),用正则提取出语言字符串,然后调用微软的接口,翻译,然后保存成新文件(会自动修改语言类型标记) 用PHP写的,花了大约2天的时间(碰到了微软的一个不科学的BUG,给Azure MarketPlace客服提交Ticket后才解决的...) |
![]() | 7 vibbow 2013-10-16 19:02:27 +08:00 擦,没写完呢,不小心点回复了。 悲剧的是,我之前那个程序在硬盘挂了后就丢了。 微软的接口在这里申请: https://datamarket.azure.com/dataset/bing/microsofttranslator 接口API在这里:http://www.microsofttranslator.com/dev/ 总体来看微软的API比Google的厚道。 |
![]() | 8 vibbow 2013-10-16 19:06:20 +08:00 微软这个API也有很多的坑,比如说每次提交请求的字数千万不能超,否则就直接报错。 XML请求里的特殊字符也要专门转义,否则也可能什么都不返回(连错误都不报!) |