想通过淘宝商品图构建一个数据集,直接用 selenium 爬会被封 ip 吗?大家有啥好办法吗?

想通过淘宝商品图构建一个数据集,直接用 selenium 爬会被封 ip 吗?大家有啥好办法吗?
2 shawnleo OP 我看有说用淘宝客 api 的? |
3 asmoker Jun 19, 2023 建议咨询梁博 |
4 lhbc Jun 19, 2023 via Android 这两个地址有不少高人,经验丰富,可以去找他们问一下 深圳市坪山区石井街道金田路 200 号 杭州市余杭区临平镇丘山大街 3 号 |
6 lithiumii Jun 19, 2023 via Android 啥数量级?几百上千 selenium 没啥问题,拿自己真的在用的帐号登录都行 |
7 zictos Jun 19, 2023 淘宝联盟 api 应该可以,只要开通了推广的商家应该都可以 |
8 bruce0 Jun 19, 2023 就淘宝反扒, 基本别想了 |
9 caesar Jun 19, 2023 现成的电商插件 都有啊 为啥还要自己开发 |
10 vus520 Jun 19, 2023 如果只是做数据集,不用大面积更新的话,难度不大。解决阿爸的律师团队就行。 |
11 Sh4ww Jun 19, 2023 只是采集图片的话,其实淘宝有很多无风控的接口,可以找找看 |
12 opengps Jun 19, 2023 电商起家的反扒能力可是第一,你要跟第一较劲,可是个相当难得事情了 |
13 LandCruiser Jun 19, 2023 @asmoker 梁博就是爬阿里被告的呀 |
14 shawnleo OP 是否可以通过淘宝客 api 或者淘宝开放平台获取呢?除了淘宝,其他的像小红书或者亚马逊之类的有可行性吗? |
15 streamrx Jun 19, 2023 via iPhone 别想了 |
16 tw93 Jun 19, 2023 面向监狱编程? |
17 akira Jun 19, 2023 直接买别人采集好的 |
18 MoozLee Jun 20, 2023 可以的,前提有可用 ip 池。 按照我们的经验跑列表接口的话,封控严的时候换一个店铺出一次滑块。用详情接口的话,基本可以不用考虑,10 几次出一个滑块吧。 如果用 rpa 的话,你得有 n 多账号,封控不严,就算出滑块也可以自动划过去。 最后,希望你们公司有牛逼的法务 |
19 PVXLL Jun 20, 2023 via iPhone 可能会吃牢饭 |
20 tLbf2p3UC4BM3H1N Jun 20, 2023 吊淘宝正常访问都给你弹验证,你还用脚本去爬他?真送人头啊? |
21 imnpc Jun 20, 2023 花钱买 API ,有专门的正规的 API ,不要自己尝试采集,正常访问刷新 3 次就有可能让你滑动解锁 |
22 lmw2616 Jun 20, 2023 好单库的开放 api 里面有,几年前用过,不知道现在还能用不,你去看看 |
24 godleon Jun 20, 2023 如果你的爬虫还建立在用 webdriver selenium 这种爬虫层面,就先别搞阿里了。 需要先熟悉别人的反爬规则,然后绕开风控。才能实现你所说的功能 |