用了网上的 python 非API方式 模拟登录新浪微薄 的代码,登录成功后抓取 微薄个人页面信息。
登录代码: https://github.com/yoyzhou/weibo_login/blob/master/weibo_login.py
同样的一个微薄页面,用urllib2的方式抓取一点问题都没,如果用tornado.httpclient.HTTPClient().fetch(url)的方式抓取就会跳转到注册界面,而且始终登录不成功,何解?
注:
如果是urllib2方式的话所有页面都能抓取成功;
tornado httpclient的方式只是部分页面会跳转到注册地址,还是有些页面可以成功抓取的。
登录代码: https://github.com/yoyzhou/weibo_login/blob/master/weibo_login.py
同样的一个微薄页面,用urllib2的方式抓取一点问题都没,如果用tornado.httpclient.HTTPClient().fetch(url)的方式抓取就会跳转到注册界面,而且始终登录不成功,何解?
注:
如果是urllib2方式的话所有页面都能抓取成功;
tornado httpclient的方式只是部分页面会跳转到注册地址,还是有些页面可以成功抓取的。
