
1 levon 2013-08-23 12:10:59 +08:00 |
2 qdvictory 2013-08-23 12:19:58 +08:00 |
3 qdvictory 2013-08-23 12:21:23 +08:00 汗,我理解错了,sorry- - |
4 qdcanyun 2013-08-23 12:37:06 +08:00 |
5 leiz 2013-08-23 12:45:29 +08:00 python有中文文字转拼音的库,不过效率不清楚 |
6 200 2013-08-23 12:56:06 +08:00 要做准确的话 就要分词 不然多音字会有问题 |
7 felix021 2013-08-23 13:32:53 +08:00 顶@200 。汉字转拼音的数据和代码很多,但是搞不定多音字,前面的那些回答都没啥用。要解决多音字,必须从语义层面入手。分词是一个比较好的方法,但是最终的实现还是需要一个"词语->拼音"的数据库,这个貌似不太好找。 |
9 kittenll 2013-08-23 14:56:30 +08:00 利用自然语言统计模型处理,可以很好的处理多音字的问题。比如HMM(隐马尔土科夫模型)。如果计算资源足够的话,可以使用n>2,不然使用n=2就可以了。 |