1 kslr 2015-07-24 01:11:26 +08:00 via Android 太白,没法讲,去看基础吧。 |
![]() | 2 Tink PRO ![]() 登陆就模拟登陆呗,表格里取值xpath不行? |
3 em70 2015-07-24 01:30:32 +08:00 ![]() 1. 登录的原理无非就是GET或者POST一个数据给服务器,成功后返回一个值保存cookie,我们知道这个原理后,模拟登录就行了,网上这种代码和资料一大把.基础的不能再基础的东西. 2.无论如何, 返回总是一个网页,去分析这个网页的HTML代码就能拿到需要的东西. @kslr 说得对. 应该先去看基础,知道网页是怎么制作的,网络协议是什么东西,还没学会走就开始飞,人都没法跟你交流. |
![]() | 4 zencoding 2015-07-24 08:46:59 +08:00 ![]() curl + xpath |
![]() | 5 xzem 2015-07-24 09:29:24 +08:00 via Android 如楼上几位所言,但我觉得楼主还是直接用火车头这类的采集软件吧,绝对比你研究php来的快,可定制性肯定受限就是了 |