
自己有一个小爬虫网站 ( http://learnbyreading.herokuapp.com/)
但感觉 Amazon 的数据太难爬了,容易被封
所以,有没有可能把爬虫的一部分写到客户端,通过用户的浏览器去爬,然后返回一部分数据给我,这样我就不用去买 IP 了。。。。。
|  |      1chwhsen      2018-12-18 23:09:51 +08:00 木马爬虫? | 
|  |      2chengxiao      2018-12-18 23:12:55 +08:00 兄弟 你这个跟肉鸡有什么区别? 哪天 high 了 一波 DDOS 带走~ | 
|  |      3kruskal      2018-12-18 23:18:29 +08:00 醒醒,把用户当肉鸡是违法行为 | 
|  |      4freed      2018-12-18 23:18:47 +08:00 你能做到这个肯定有比较大的控制权限了,还靠他来爬东西? 啥时候开始了告诉一声啊.我看看有没有达到量刑标准,要判几年 | 
|      5cqcn1991 OP | 
|  |      6orangeade      2018-12-18 23:43:40 +08:00 不如先爬免费的 IP 代理池 | 
|  |      7gamexg      2018-12-18 23:51:03 +08:00 感觉比价插件是一个很好的分布式爬虫。 用户打开商品页面显示价格历史时自动将商品当前价格上传。 | 
|      8t6attack      2018-12-18 23:52:37 +08:00 浏览器的 跨域限制 就是针对你的。 | 
|  |      9Trim21      2018-12-18 23:56:39 +08:00 你想问的是无头浏览器吗, 还是真的像楼上说的那样想用某些正常用户的浏览器爬数据 | 
|  |      10westoy      2018-12-18 23:57:07 +08:00 不可能, 但是可以让用户通过类似 yahoo YQL 的方法给你提供数据, 问题是验证数据真实性的成本可能比多搞一个 IP 池高...... | 
|  |      11freed      2018-12-19 00:08:11 +08:00 @gamexg 不一样,比价插件是用户自己打开某些网页读取到了数据的,楼主是想控制用户打开他指定的网页爬取数据再回传给服务器.. | 
|  |      12akafeng      2018-12-19 00:10:08 +08:00 via iPhone 楼主大概需要什么量级的代理池呢? | 
|  |      13agdhole      2018-12-19 01:03:00 +08:00 京价保插件不就是这个原理吗 | 
|  |      14onedayoneapple      2018-12-19 07:02:52 +08:00 via iPhone @orangeade 这个怎么爬 | 
|  |      16wly19960911      2018-12-19 08:25:31 +08:00 via Android js 的话浏览器跨域怎么解决 | 
|  |      17woshipanghu      2018-12-19 09:03:04 +08:00 electron nightmare 你去看看 可能是你要的  没什么浏览器跨域的问题,直接往页面里面注入你的 js 都行 | 
|  |      18zhchyu999      2018-12-19 09:30:21 +08:00 有 refer 的 | 
|      20boweixiaobang      2019-08-08 14:53:36 +08:00 小帮软件机器人,是做客户端软件数据的自动采集和写入的。 CS 的采集和写入小帮都有优势。 |