爬虫兼职, 要求爬取一亩三分地, twitter, 知乎, 公众号等渠道的招聘和招生信息 - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
samuel9209
V2EX    外包

爬虫兼职, 要求爬取一亩三分地, twitter, 知乎, 公众号等渠道的招聘和招生信息

  •  
  •   samuel9209 37 天前 1323 次点击
    这是一个创建于 37 天前的主题,其中的信息可能已经有所发展或是发生改变。

    职位概述

    我们正在寻找一位经验丰富的兼职爬虫开发工程师,负责从国内外多个平台自动化采集招聘和招生相关信息。该职位工作时间灵活,按项目结算报酬,合作起步价 1 万人民币。

    工作职责

    设计并实现稳定高效的网络爬虫系统,定向采集指定平台的公开信息 负责爬虫架构设计、数据采集、清洗、去重和存储全流程开发 监控爬虫运行状态,及时处理反爬机制、封禁等问题 与数据分析团队协作,确保数据质量和交付时效性 编写技术文档和操作手册

    核心技术要求

    熟练使用 Python 及 Scrapy 、BeautifulSoup 、Selenium 、Playwright 等爬虫框架 掌握 HTTP/HTTPS 协议、Cookie 、Session 、代理 IP 池等技术 熟悉常见反爬机制(验证码、IP 限制、User-Agent 检测、动态加载等)及应对策略 具备数据清洗、去重和结构化存储经验( MySQL/MongoDB/Elasticsearch ) 了解爬虫法律法规和 robots.txt 协议

    平台特定要求

    一亩三分地: 熟悉论坛类网站结构,能处理登录态保持和权限限制 具备动态页面渲染和 AJAX 请求分析能力

    Twitter: 熟练使用 Twitter API v2 或具备爬虫逆向能力 了解 GraphQL 接口调用和速率限制处理 能够模拟真实用户行为规避检测

    知乎: 熟悉知乎反爬策略(如滑块验证、IP 封禁等) 能够处理动态加载内容和登录状态管理

    加分项 有招聘/招生类信息爬取项目经验 具备分布式爬虫( Scrapy-Redis )和云端部署经验 熟悉 Docker 、Kubernetes 等容器化技术 有自然语言处理基础,能进行简单文本分类和实体提取

    申请说明 请将简历和爬虫项目案例( GitHub 链接或代码片段)发送至招聘邮箱[email protected],并说明擅长和可以开始兼职的时间。

    3 条回复    2025-11-10 18:00:01 +08:00
    macaodoll
        1
    macaodoll  
       37 天前
    有国内全部主流招聘平台+大型企业官网招聘信息抓取经验,可以嘛?从 0 到 cicd 部署都可以
    samuel9209
        2
    samuel9209  
    OP
       35 天前
    @macaodoll 可以啊, 可以发我邮件或者留个 wechat 我加你
    macaodoll
        3
    macaodoll  
       35 天前
    @samuel9209 S2luZ0ZhbHNl
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     3170 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 22ms UTC 11:15 PVG 19:15 LAX 03:15 JFK 06:15
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86