准备提供一个:中文分词在线接口 API
功能:中文分词,初级的实体识别
费用:每日 3000 次以内免费
原因:目前 JCJC 错别字检测服务器有 5 台服务器,部分资源闲置。
调查内容:
大家对:中文分词在线服务,有那些期望呢?
谢谢大家
功能:中文分词,初级的实体识别
费用:每日 3000 次以内免费
原因:目前 JCJC 错别字检测服务器有 5 台服务器,部分资源闲置。
调查内容:
大家对:中文分词在线服务,有那些期望呢?
谢谢大家

1 stlee Feb 25, 2019 via Android 梁博的 pullword 挺不错。 |
2 shm7 Jul 1, 2019 via iPhone jieba thulac pkuseg pynlpir pyltp 还有 hanlp corenlp fudanlp,想不通。 |
3 proofreading OP |
4 proofreading OP 打错字了, 正确的字:方案。 |
5 KalaSearch Sep 5, 2020 我觉得切词 API 的需求应该还是大的,主要是极多情况下大家的主要业务也不是分词本身,所以一味追求分词准确度没有意义,还不如用一个效果“合理”的 API 合理的定义当然非常主观,但对多数人来说,分词的作用就是做搜索。我们的经验中,要把分词琢磨清楚再把搜索琢磨清楚还是很不容易的。 ES 有不少分词用的插件,但要比较各种分词的效果(索引分词效果和搜索分词效果)会需要比较多的上下文知识。通常 Analyzer 和 Query analyzer 必须用同样的分词器,但也会造成有的时候某个词就是搜不出来的情况。 所以如果是做搜索,且预算允许的话,自荐下我们做的卡拉搜索,啥也不用配置,接上 API 瞬间开搜,后台直接控制排序算法也很方便(灵感来自于 Algolia,算是个跟 ES 很不一样的独创吧)。 速度在我们的 benchmark 上比优化过的 ES 还快 10 倍左右,欢迎试用 |
6 proofreading OP 非常好 @KalaSearch , 我尝试一下你们的服务。 |