![]() | 1 bao3 2016-09-16 14:01:39 +08:00 via Android 哈哈,我正在找这种,我正好要租房,所以想要这种可以抓下来统计,再下手的脚本。我是小白,所以感谢了。叩拜 |
![]() | 2 wyntergreg 2016-09-16 17:53:06 +08:00 scrapy 略慢啊 |
![]() | 3 asd103 2016-09-16 21:25:58 +08:00 看来, V2EX 已经没人对这种感兴趣了,除非你说你爬了某榴 |
![]() | 4 zhongshaohua 2016-09-16 2:43:54 +08:00 @tumbzzc 爬了草某也可以的 |
![]() | 5 LokiSharp 2016-09-16 22:03:26 +08:00 为什么 items 要分成 3 个,而里面的 class 名都取 ItjuziItem 啊= =感觉这样好乱啊。。。 |
![]() | 6 plantparknet OP |
![]() | 7 plantparknet OP @LokiSharp 才学,并不是特别会用。。。 |
![]() | 8 sparkssssssss 2016-09-17 08:14:04 +08:00 via Android 马克!感谢分享! |
![]() | 11 plantparknet OP @icylord 哈哈哈哈 看来是不会翻墙呀~~ 放到收藏夹好久了~~ 可惜的是某榴的种子文件下载是非常麻烦呀~~ |
![]() | 12 noahyu 2016-09-18 09:51:50 +08:00 去年年初爬过,当时的数据水分很大,同一房源重复发布频率很高(不是对房源更新,而是另外发一条) 需要做一些去重处理后再分析 |
![]() | 13 plantparknet OP @noahyu 哦,数据爬取下来还没分析呢~~ 还没注意到这个问题 |