
我建了两个网站,没有任何被任何博客添加友链,没有在任何网站上留下过 url ,但是我都在这两个服务器里的 access.log 里看到了谷歌爬虫(虽然我设置了 robots.txt 不让爬取)。难不成是靠遍历 ip 地址吗?
1 xzem 2016-11-17 20:08:41 +08:00 比如说 chrome |
2 DesignerSkyline 2016-11-17 20:13:21 +08:00 via iPad Google chrome 的安全检测服务可能会导致这个现象 |
3 yankebupt 2016-11-17 20:16:25 +08:00 via Android 爬的时候不遵循 robots.txt 的也有可能是伪造成谷歌爬虫的其他爬虫,比如安全机构 |
4 yushiro 2016-11-17 20:18:53 +08:00 via iPhone 网站有域名,根据域名注册商的列表爬。 |
5 syahd OP @DesignerSkyline 什么意思? |
7 DesignerSkyline 2016-11-17 22:13:38 +08:00 @whwq2012 safebrowsing probes |
11 flynaj 2016-12-15 00:09:24 +08:00 via Android 看 ip 地址,如果不是 google 的服务器就是伪造的,可能是扫描 |