数据库中有 10w 条没有分类的文章,含有标题,内容(文本),创建时间等等字段
现在需要将这 10w 数据分到政策,行情,军事等等 7 个分类下
有没有好的解决方案
![]() | 1 maemolee 2018-12-03 17:10:01 +08:00 对七个分类预设一批关键词,去匹配?我瞎说的,抛砖引玉。 |
![]() | 2 xiaoxinshiwo 2018-12-03 17:21:19 +08:00 分表 或者 es |
3 gsscsd 2018-12-03 17:23:45 +08:00 via Android tfidf+机器学习多分类或者词向量+深度学习多分类 |
![]() | 4 banks0913 2018-12-03 17:24:34 +08:00 scikit-learn,利用朴素贝叶斯分类器训练模型 |
![]() | 5 to 2018-12-03 18:01:05 +08:00 via Android 小批量训练个模型就好了 |
6 yangzhezjgs 2018-12-03 22:59:11 +08:00 via Android 文本分类了解一下 |