
1 keller 2014-02-12 17:16:37 +08:00 关系到分词算法和语意分析 具体能够直接应用的API应该还没有 |
2 9hills 2014-02-12 17:21:09 +08:00 没有这么高级的API。。 |
3 RangerWolf 2014-02-12 17:21:24 +08:00 我只知道有一些api 能自动的检测是不是垃圾评论 比如 wordpress 自带的那个 名字一下不记得了 |
4 shikailun 2014-02-12 17:31:01 +08:00 如果分类事先确定的话,贝叶斯分类算法貌似可以实现楼主的需求 |
5 y051313 2014-02-12 17:32:45 +08:00 有,但是收费的 我们公司在用的是Automony提供的http://www.autonomy.com.cn/content/Functionality/idol-functionality-categorization/index.zh.html,需要人工写规则,然后大批量文本做training |
6 shikailun 2014-02-12 17:40:18 +08:00 朴素贝叶斯在文本分类中的应用 http://yzmduncan.iteye.com/blog/1930695 |
7 txlty 2014-02-12 17:44:56 +08:00 这东西应该很值钱的。可以直接用于做垃圾站赚钱。 |
9 cctvsmg 2014-02-12 18:07:45 +08:00 jieba分词,自己做个词库 |
11 YouXia 2014-02-12 18:55:50 +08:00 via Android @shinebay 卖服务就可以啊。大公司养这么多科学家,比如做数据挖掘,文本分类,聚类等等相关的,就是为了解决此或类似的问题啊。小公司没有这么多人力和财力,如果需要用到这种东西,可能会考虑买别人的服务了。 |
12 crossmaya 2014-02-12 21:39:34 +08:00 mark一下。 |
14 y051313 2014-02-12 21:59:49 +08:00 具体价格我不是很清楚,是global负责的,他们提过一句这个是按照用量来收费的。 我们用到这个CatEngine的是一个多语言数据库,这个程序实现了对全部13种语言文档的自动分类识别。 | /tr>