举例, www.baidu.com ,那就分为搜索网站, www.jd.com ,分为电商网站,以此类推。。。。。。
![]() | 1 cctv6 2016-10-30 19:10:33 +08:00 via Android 目测只能手动 机器不大可能知道你的那个域名是什么网站 而且不确定你的那几十万个域名是不是可以访问的 |
![]() | 2 zachlhb 2016-10-30 19:11:50 +08:00 via Android 这个没办法吧,除非有网址库 |
![]() | 3 knightdf 2016-10-30 19:13:31 +08:00 这叫根据域名?难道这不叫根据内容? |
![]() | 4 puyo 2016-10-30 19:39:10 +08:00 可不可以根据域名对应网站的 description 或者 keywords 来做分类 |
![]() | 5 murmur 2016-10-30 19:50:35 +08:00 只根据域名无解 还有多少个数字网站呢 |
![]() | 6 huage 2016-10-30 20:20:19 +08:00 没有办法 |
![]() | 7 dsg001 2016-10-30 20:25:52 +08:00 采集域名 alexa 数据, alexa 有分类 |
![]() | 8 CRight 2016-10-30 20:32:54 +08:00 3721 能做到吧... |
9 bazingaterry 2016-10-30 20:49:56 +08:00 只能机器学习了? |
![]() | 10 huluhulu 2016-10-30 21:32:51 +08:00 采集这些域名的主页, 如果可以,采集主页上的链接页面的内容。 然后 TF-IDF 算法简单算一下,分成几类之后,就可以看看每一类大概是什么内容了。数据挖掘自动化分类的范畴。 |
![]() | 11 alittletrain 2016-10-30 22:08:28 +08:00 |
![]() | 12 lhx2008 2016-10-30 22:13:35 +08:00 @alittletrain 事实上,还真有一个这样搞事的网站 baidu.wf |
![]() | 13 alittletrain 2016-10-30 22:23:34 +08:00 @lhx2008 世界之大,无。。。。 |