
爬虫爱好者一枚,写了两个系列爬虫教程,分享给有需要的人,后续会不定时更新
第一课 找个软柿子捏捏 http://blog.csdn.net/youmumzcs/article/details/51373830
第二课 实战尚妆网分页商品采集爬虫 http://blog.csdn.net/youmumzcs/article/details/51383648
第三课 实战尚妆网 AJAX 请求处理和内容提取 http://blog.csdn.net/youmumzcs/article/details/51384741
第四课 淘宝网商品爬虫自动 JS 渲染 http://blog.csdn.net/youmumzcs/article/details/51385856
第五课 京东商品评论爬虫 一起来对付反爬虫 http://blog.csdn.net/youmumzcs/article/details/51396283
第一课 p2p 网贷爬虫( XPath 入门) http://blog.csdn.net/youmumzcs/article/details/51455296
第二课 雪球网股票爬虫(正则表达式入门) http://blog.csdn.net/youmumzcs/article/details/51463991
第三课 雪球网股票爬虫( ajax 分析) http://blog.csdn.net/youmumzcs/article/details/52033622
第四课 雪球网股票爬虫(单页面多数据) http://blog.csdn.net/youmumzcs/article/details/52047814
大家对什么爬虫最有兴趣,想用爬虫获取什么数据,有什么反馈建议,都欢迎留言
1 oceantree OP 不是刚发的帖子,怎么变成 4 小时之前的了 |
2 sanwenshi 2016-07-28 14:26:03 +08:00 支持一个 |
3 oceantree OP 一打开消息 165 次点击 14 人收藏 就没人给个意见啥的 |
4 qiayue PRO 90 分钟 16 个收藏很不错了,说明还是有人认可你的教程的 |
6 ango 2016-07-28 16:01:56 +08:00 收下了,有时间再看看 |
7 Myflos 2016-07-28 16:20:32 +08:00 干货,先收了 |
10 harry890829 2016-07-28 16:36:14 +08:00 不知道评论什么,反正晚点回去看看 |
11 kchum 2016-07-28 16:40:26 +08:00 是不是还可以上一下分布式爬虫,调度之类的。 |
12 Wy4q3489O1z996QO 2016-07-28 16:41:25 +08:00 有什么办法使用 cacheImg 处理图片数组吗? |
13 aidoudou 2016-07-28 16:42:50 +08:00 先收藏,再慢慢看 |
16 coolair 2016-07-28 17:04:52 +08:00 这些东西没什么意义吧?主要就是分析链接? 推广你的“神箭手云爬虫 框架”? “神箭手云爬虫 框架”在哪?开源吗? |
17 abctest 2016-07-28 17:08:33 +08:00 |
18 oceantree OP |
19 Wy4q3489O1z996QO 2016-07-28 17:18:56 +08:00 @oceantree cacheImg 返回了奇怪的东西: shenjianshou://http://image.xx.com/showImage.aspx?t=a1&v=10000A998 |
20 qiayue PRO 文章还是有价值的,不过建议楼主(神箭手 CEO )下次来 V2EX 发帖,就正正当当的在文章开头表明身份表明利益关系更好。 我玩 V2EX 五六年了,一般来讲真心实意来推广自己产品的,广大 V 友是欢迎的,但是如果遮遮掩掩来推广,反倒不受欢迎。 比如前几天的 OneAPM 演了一场戏,结果被扒皮了。 |
21 harry890829 2016-07-28 17:21:25 +08:00 @abctest 我粗略看了一眼文章,大概了解了一下,发现是软文,或者说是推广吧,不过当时没有明说…… |
22 oceantree OP |
23 123s 2016-07-28 17:25:25 +08:00 via iPhone 已加入豪华午餐 |
25 vtea 2016-07-28 17:28:50 +08:00 via iPhone 顶楼主,最近写爬虫卡在爬 ajax 类动态网页上了 |
28 miao 2016-07-28 19:03:37 +08:00 果然是软文. 好在可以防爬虫 |
30 upczww 2016-07-28 19:31:34 +08:00 神箭手的广告 |
31 nikola 2016-07-28 19:40:11 +08:00 mark |
32 oceantree OP |
33 pheyer 2016-07-29 12:40:56 +08:00 lz 有试过把淘宝全部商品爬完要多长时间吗? |
35 cangbaotu 2016-08-15 19:41:46 +08:00 赞作者,刚好需要,赶紧去拜读一下( ̄ ̄)" |
37 jy00566722 2017-05-14 22:53:41 +08:00 @oceantree 太贵了,不给人入门窥探的机会。 我还充了值,以为市场里那些爬虫可以玩一把。 仔细一看才发现自己多天真,原来是要会员等才可以用的。随便一个有用的都是个人旗舰版。还是整 scrapy 吧。 |