现在的反爬技术,已经让一些没有安全相关的工作者无法进行。scrapy 这类框架貌似还是使用 http 协议相关的操作。不知道现在各位大佬都在用什么让自己可以有更多的摸鱼时间的工具!
萌新求助
1 march1993 162 天前 我感觉 scrapy 只是个玩具,chromedp 之类的依靠 Chrome DevTools Protocol 的才是正经爬虫方案 |
![]() | 2 Ketteiron 162 天前 2025 年了,除了无头的方案都可以退休了。国内还好,一堆网站跟不设防差不多,你可以继续用上古爬虫,国外全上了 CF/AWS ,过 js 挑战以及伪造 tls 指纹是最基本的,掂量下非无头能不能实现,就算实现了难度和时间花费不是一个量级的。 |
4 mumbler 162 天前 ![]() 首选 browser use |
![]() | 5 lasuar 162 天前 大家都没有心思再去分析复杂的接口了,基本都是上无头。scrapy 已经廉颇老矣了。 |
6 rainbowmorel OP @mumbler 这个会不会有点慢 |
7 rainbowmorel OP @march1993 11111 |
8 QHKZ 157 天前 via iPhone 试试一些自动化测试框架吧,比如谷歌浏览器的 puppeteer ,前端的 playwright 框架。这些东西比 scrapy 要强不少,动态网站也能爬,还能模拟输入重放,能不能过反爬不好说。 |
9 rainbowmorel OP @crab 啊原来还有这个东西 666 我一直以为只能用无头浏览器的 |