2025 年如果还想做一些爬虫相关的任务，还是首选 scrapy 吗？

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

已注册用户请登录

这是一个创建于 239 天前的主题，其中的信息可能已经有所发展或是发生改变。

现在的反爬技术，已经让一些没有安全相关的工作者无法进行。scrapy 这类框架貌似还是使用 http 协议相关的操作。不知道现在各位大佬都在用什么让自己可以有更多的摸鱼时间的工具！

萌新求助

9 条回复 2025-05-21 11:05:01 +08:00

march1993

239 天前

我感觉 scrapy 只是个玩具，chromedp 之类的依靠 Chrome DevTools Protocol 的才是正经爬虫方案

Ketteiron

239 天前

2025 年了，除了无头的方案都可以退休了。国内还好，一堆网站跟不设防差不多，你可以继续用上古爬虫，国外全上了 CF/AWS ，过 js 挑战以及伪造 tls 指纹是最基本的，掂量下非无头能不能实现，就算实现了难度和时间花费不是一个量级的。

crab

239 天前

mumbler

239 天前

首选 browser use

lasuar

238 天前

大家都没有心思再去分析复杂的接口了，基本都是上无头。scrapy 已经廉颇老矣了。

rainbowmorel

235 天前

@mumbler 这个会不会有点慢

rainbowmorel

235 天前

QHKZ

234 天前 via iPhone

试试一些自动化测试框架吧，比如谷歌浏览器的 puppeteer ，前端的 playwright 框架。这些东西比 scrapy 要强不少，动态网站也能爬，还能模拟输入重放，能不能过反爬不好说。

rainbowmorel

219 天前

@crab 啊原来还有这个东西 666 我一直以为只能用无头浏览器的