这是一个创建于 1966 天前的主题,其中的信息可能已经有所发展或是发生改变。
没做过爬虫,需求是这样的:
20+个网页,每个网页里面有几十个数据条目。
设定好规则抓取数据, 希望每天开机时自动跑一遍收集下数据就可以了,不限工具。Web Scraper 的 Sitemap Json 不支持批量 URL 导入,20+个网页挨个点还是麻烦
之前查了下 Puppeteer 很好上手,不过跑了下,触发反爬机制了(里面有几个网页是电商的=_=)。
3 条回复 2020-07-28 22:29:24 +08:00  | | 1 ila 2020-07-28 20:47:09 +08:00 via Android 加钱,楼下帮你搞定 |
 | | 2 locoz 2020-07-28 21:13:05 +08:00 via Android 2 八爪鱼,下一个 |
 | | 3 Hansah 2020-07-28 22:29:24 +08:00 1 火车浏览器 /火车采集器 |