![]() | 1 49 2015-05-23 18:56:16 +08:00 这排版有一种 氯 的味道 >_< |
![]() | 2 ChiangDi 2015-05-23 19:08:55 +08:00 看了她的 weibo ,感觉基因好完美,应该很多男生会有跟她繁衍后代的欲望。。。 |
3 ddqp 2015-05-23 19:19:54 +08:00 顶! |
4 libraor 2015-05-23 19:50:34 +08:00 ![]() 你们都没发现照片都不是她自己,而是另外一个很亲密的人拍的么?so,骚年啊,不要YY了,快去写代码吧。。 |
![]() | 5 jason52 OP |
![]() | 6 jason52 OP ![]() |
7 feiyuanqiu 2015-05-23 20:50:30 +08:00 |
![]() | 8 neone 2015-05-23 20:50:38 +08:00 忍不住点开她微博看了下(原谅我,我还是一个少年)。另外,思路的话由于对爬虫不是很了解,所有并不敢大声说话。 |
![]() | 9 jason52 OP @feiyuanqiu 恩,还有个casperjs,基于你说的这个封装了一层,我考察了一番~~~ |
![]() | 10 mianju 2015-05-23 21:25:17 +08:00 说好的手把手教程呢? |
![]() | 11 vjnjc 2015-05-23 21:37:54 +08:00 你们是怎么找到她得weibo得,有诀窍么? |
![]() | 14 staticor 2015-05-23 21:59:14 +08:00 本来就是想学习Python技术的. 搞这么一个照片弄没心情学了- . |
![]() | 15 binux 2015-05-23 22:28:15 +08:00 完全没有看出来这个页面有什么难的了。。 http://demo.pyspider.org/results?project=zhinsta |
![]() | 19 jason52 OP @binux 话说pyspider一出,爬虫其实就不用写"程序"啦。主要就是写一个配置文件定义一下所要的参数,所有的循环和判断部分可以省掉了。 |
21 jianghu52 2015-05-23 23:45:58 +08:00 我比较笨。用的是比较笨的方法。 这个页面写的挺规矩的。要是我爬的话,首先进入第一页就不用说了。 然后Beautiful Soup来遍历文件,class= photos的只有一个地方,下面的ul 下面的li 里面就是图片了。 之后 [更多] 里面的href也写的比较明白。直接拼好连接做一个迭代再继续模拟访问。就能得到新的一页。 这样就能一直到最后一页。至于最后一页有没有 [更多] 我也不知道。快12点了。我准备睡觉了。以上纯粹脑洞。如果有问题,欢迎拍砖。 |
![]() | 22 O21 2015-05-23 23:54:57 +08:00 很简单的。。。自己看一天python 就会了。 |
![]() | 23 xuhaotian 2015-05-24 04:13:26 +08:00 微博 instagram 已双关注 先闪,谢谢lz |
![]() | 24 won 2015-05-24 08:57:32 +08:00 via iPhone 没任何图形识别技术在里面嘛,我觉得还是爬马赛克图片更直接 |
![]() | 25 jason52 OP 实验一下~~ ![]() |
![]() | 26 jason52 OP 楼主给的一个解~经大神一点拨,完全不用上js解析了唉(摊手) ![]() |
![]() | 29 lhbc 2015-05-24 12:24:52 +08:00 剑桥化学女学霸,分分钟让你死了都不知道怎么回事,哈哈哈 |
![]() | 31 shepherd 2015-05-25 01:11:07 +08:00 这样真的好吗?一群人围着别人相册YY 不过,看完相册真的就不觉得累了啊。 |