V2EX frogex
首页
注册
登录
frogex 最近的时间轴更新
frogex
V2EX 第 368733 号会员,加入于 2018-12-07 12:03:46 +08:00
frogex
提问
技术话题
好玩
工作信息
交易信息
城市相关
淘宝反爬求解
Python
frogex
2020-07-10 15:07:57 PM
最后回复来自
no13bus
72
frogex 创建的更多主题
frogex 最近回复了
2019-01-19 15:46:52 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
xiao38245
手机淘宝是二进制的协议吧,要破协议,这个我没经验。而且直接抓接口的方法淘宝随便封更容易,感觉还是模拟人的操作稍微靠谱点
2019-01-19 10:50:03 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
IWSR
那能怎么办?讨论爬虫的帖子超级多,可讨论反爬的实在太少了,工作这么久身边也基本没一个人做过这些的
2019-01-18 16:21:03 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
dengtongcai
请看全文,不仅是登陆,是要长期稳定的爬,且能过各种滑块,目前最终方案在 23F, 放 win 虚拟机跑了
2019-01-18 11:35:34 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
dengtongcai
爬简单,要能稳定长期、全自动化、有效的爬才难啊
2019-01-18 11:34:41 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
yinaqu
淘宝检测了什么我不确定是不是只在 sufei_data 那个 js 里,从我分析看,至少有检测了 10 个函数,至少 headless 都 pass 了和非 headless 一样的结果。其他的实在看不下去了,都是混淆过的代码,命名 abcdefg,函数各种混着赋值,似乎要人肉维护一个函数调用关系
2019-01-18 11:32:06 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
soulmine
我也知道,公司安全的负责人也说,你一个人怎么能应付一个团队,不要硬肛,要想别的办法,但什么大淘客还是不行啊,搜不到我要的。 但这爬东西又是公司必须的任务,之前从来没搞过,忧虑了好久,总没彻底去解决。
淘宝也有付费 api,不过 leader 还是希望能神不知鬼不觉的用爬虫比较好
2019-01-18 10:08:23 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
lkwfive
没试过这个,有空试下吧,不过用什么工具 taobao 应该还是都会检测的
2019-01-18 10:02:59 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
yinaqu
工作很多年了,90%时间写 C++
2019-01-18 09:35:43 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
yumenlong
不会 pyqt,不过应该不只是 selenium 的问题,光看 taobao 的 js 就有 chromedriver 的指纹检测
2019-01-18 09:34:41 +08:00
回复了
frogex
创建的主题
Python
淘宝反爬求解
@
yangsi
当然可以,主要是不能确定靠什么检测的,试过 PhantomJS 也是不行
frogex 创建的更多回复
关于
帮助文档
自助推广系统
博客
API
FAQ
Solana
5313 人在线
最高记录 6679
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 14ms
UTC 05:53
PVG 13:53
LAX 22:53
JFK 01:53
Do have faith in what you're doing.
ubao
msn
snddm
index
pchome
yahoo
rakuten
mypaper
meadowduck
bidyahoo
youbao
zxmzxm
asda
bnvcg
cvbfg
dfscv
mmhjk
xxddc
yybgb
zznbn
ccubao
uaitu
acv
GXCV
ET
GDG
YH
FG
BCVB
FJFH
CBRE
CBC
GDG
ET54
WRWR
RWER
WREW
WRWER
RWER
SDG
EW
SF
DSFSF
fbbs
ubao
fhd
dfg
ewr
dg
df
ewwr
ewwr
et
ruyut
utut
dfg
fgd
gdfgt
etg
dfgt
dfgd
ert4
gd
fgg
wr
235
wer3
we
vsdf
sdf
gdf
ert
xcv
sdf
rwer
hfd
dfg
cvb
rwf
afb
dfh
jgh
bmn
lgh
rty
gfds
cxv
xcv
xcs
vdas
fdf
fgd
cv
sdf
tert
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
sdf
shasha9178
shasha9178
shasha9178
shasha9178
shasha9178
liflif2
liflif2
liflif2
liflif2
liflif2
liblib3
liblib3
liblib3
liblib3
liblib3
zhazha444
zhazha444
zhazha444
zhazha444
zhazha444
dende5
dende
denden
denden2
denden21
fenfen9
fenf619
fen619
fenfe9
fe619
sdf
sdf
sdf
sdf
sdf
zhazh90
zhazh0
zhaa50
zha90
zh590
zho
zhoz
zhozh
zhozho
zhozho2
lislis
lls95
lili95
lils5
liss9
sdf0ty987
sdft876
sdft9876
sdf09876
sd0t9876
sdf0ty98
sdf0976
sdf0ty986
sdf0ty96
sdf0t76
sdf0876
df0ty98
sf0t876
sd0ty76
sdy76
sdf76
sdf0t76
sdf0ty9
sdf0ty98
sdf0ty987
sdf0ty98
sdf6676
sdf876
sd876
sd876
sdf6
sdf6
sdf9876
sdf0t
sdf06
sdf0ty9776
sdf0ty9776
sdf0ty76
sdf8876
sdf0t
sd6
sdf06
s688876
sd688
sdf86