PureblueAI:知道 V2EX 藏龙卧虎,我司诚招 [中高级数据采集工程师(Web+Android)] - V2EX
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
外包信息请发到 /go/outsourcing 节点。
不要把相同的信息发到不同的节点
snakeninny
V2EX    酷工作

PureblueAI:知道 V2EX 藏龙卧虎,我司诚招 [中高级数据采集工程师(Web+Android)]

  •  
  •   snakeninny 1 月 14 日 1003 次点击
    这是一个创建于 60 天前的主题,其中的信息可能已经有所发展或是发生改变。

    特别说明

    • 我们为你提供从竞争白热化的移动互联网红海赛道,向 AI-native 应用全新蓝海领域转型的稀缺战略机遇。
    • 我们秉持结果导向,核心团队均由各领域资深专家领衔,从根源上杜绝 “外行指导内行” 的情况;管理上坚决摒弃微观管理( micro-manage ),充分赋予团队自主决策与执行空间。
    • 团队成员中既有退役军人,也有伙伴;既有大专生,也有博士后。人员背景多元包容,招聘不设学历门槛,始终坚持唯才是举。

    官网

    https://www.pureblueai.com/

    职位描述

    • 主导 Android 端核心数据采集方案的设计与落地,负责主流及高难度 APP 的数据挖掘,包括复杂 UI 交互分析、数据交互逻辑还原、加密协议破解等核心工作,为 AI 大模型训练提供高质量数据支撑。
    • 深耕 Android 端逆向工程:负责 Android APP 的脱壳、加解密分析,精通 Smali/Java 代码还原,基于 Arm64 指令集进行汇编级分析,主导 Xposed/LSPosed 插件、Frida 脚本的设计与开发,实现对目标 APP 的 Hook 与数据拦截。
    • 主导 Android 端风控对抗体系搭建:针对 APP 端的设备指纹( IMEI/AndroidID/OAID )、Root 检测、行为验证、签名校验、进程注入检测等风控策略,设计并落地有效的对抗方案,保障采集任务的稳定运行。
    • 负责 Android 端自动化采集框架的设计与优化:基于 UiAutomator 、Espresso 等框架封装高效的自动化采集工具,实现复杂场景下的 APP 自动操作、数据提取与异常重试,提升采集效率与稳定性。
    • 参与 Web 端中高难度数据采集任务:基于 Python 生态爬虫框架( Scrapy/Playwright )开发复杂动态渲染页面( SPA/Vue/React )的抓取逻辑,协助破解 Web 端 JS 混淆、参数签名等加密机制。
    • 深入分析 Web 及 Android 端网络协议( HTTP/HTTPS/WebSocket/gRPC ),主导复杂协议的还原与模拟,协助构建分布式数据采集架构,参与采集任务的分布式调度与性能优化(并发控制、速率调节)。
    • 协同 AI 算法团队输出标准化数据格式,优化数据采集流程与质量校验机制;沉淀 Android 逆向、双端风控对抗等技术经验,形成技术文档与团队共享。

    岗位要求

    • 3 ~ 5 年数据采集相关经验,其中至少 2 年以上 Android 端数据采集/逆向核心经验,具备高难度 Android APP 逆向(如加固脱壳、复杂加密协议还原)及风控对抗的实战落地案例。
    • 精通 Android Framework ,深入理解 AccessibilityService 原理、UI 渲染机制、AMS/PMS 等系统服务工作流程;熟练掌握 Smali 指令、Arm64 指令集,能够独立完成 Android APP 的静态分析与动态调试。
    • 具备扎实的 Android 开发与逆向技能:能够独立开发 Xposed/LSPosed 插件、Frida 脚本;熟练使用 IDA Pro 、Jadx 、Apktool 等逆向工具;有 APP 加固( 360 加固、爱加密等)脱壳经验者优先。
    • 精通 Android 端网络协议分析:能够使用 Charles/Fiddler/Wireshark 等工具完成复杂网络抓包,独立还原 HTTPS/WebSocket 等协议的加密交互逻辑;了解 Android 端网络请求框架( OkHttp/Retrofit )的工作原理。
    • 具备 Web 端数据采集基础:熟悉 Python 编程语言,熟练使用 Scrapy 、Playwright 等爬虫框架及数据解析工具;具备 Web 端 JS 逆向、参数加密破解、基础反爬( IP 代理、浏览器指纹)对抗经验。
    • 了解分布式数据采集架构:熟悉 Redis (缓存/队列)、MongoDB 等中间件的使用,能够基于 Scrapy-Redis 等框架实现简单的分布式任务调度;具备大规模数据采集场景下的问题排查与性能优化能力。
    • 具备较强的独立攻坚能力、问题分析与解决能力,良好的沟通协作意识与技术沉淀意愿,能承受高难度任务压力,自驱力强。

    工作地址

    北京市海淀区清华同方科技广场 D 座 20 层 或 北京市朝阳区锐创国际中心 A 座 12 层

    薪资

    30 ~ 50 * 13 薪

    联系方式

    [email protected] 或 本站私信

    目前尚无回复
    关于     帮助文档     自助推广系统     博客     API     FAQ     Solana     853 人在线   最高记录 6679       Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 23ms UTC 20:56 PVG 04:56 LAX 13:56 JFK 16:56
    Do have faith in what you're doing.
    ubao msn snddm index pchome yahoo rakuten mypaper meadowduck bidyahoo youbao zxmzxm asda bnvcg cvbfg dfscv mmhjk xxddc yybgb zznbn ccubao uaitu acv GXCV ET GDG YH FG BCVB FJFH CBRE CBC GDG ET54 WRWR RWER WREW WRWER RWER SDG EW SF DSFSF fbbs ubao fhd dfg ewr dg df ewwr ewwr et ruyut utut dfg fgd gdfgt etg dfgt dfgd ert4 gd fgg wr 235 wer3 we vsdf sdf gdf ert xcv sdf rwer hfd dfg cvb rwf afb dfh jgh bmn lgh rty gfds cxv xcv xcs vdas fdf fgd cv sdf tert sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf sdf shasha9178 shasha9178 shasha9178 shasha9178 shasha9178 liflif2 liflif2 liflif2 liflif2 liflif2 liblib3 liblib3 liblib3 liblib3 liblib3 zhazha444 zhazha444 zhazha444 zhazha444 zhazha444 dende5 dende denden denden2 denden21 fenfen9 fenf619 fen619 fenfe9 fe619 sdf sdf sdf sdf sdf zhazh90 zhazh0 zhaa50 zha90 zh590 zho zhoz zhozh zhozho zhozho2 lislis lls95 lili95 lils5 liss9 sdf0ty987 sdft876 sdft9876 sdf09876 sd0t9876 sdf0ty98 sdf0976 sdf0ty986 sdf0ty96 sdf0t76 sdf0876 df0ty98 sf0t876 sd0ty76 sdy76 sdf76 sdf0t76 sdf0ty9 sdf0ty98 sdf0ty987 sdf0ty98 sdf6676 sdf876 sd876 sd876 sdf6 sdf6 sdf9876 sdf0t sdf06 sdf0ty9776 sdf0ty9776 sdf0ty76 sdf8876 sdf0t sd6 sdf06 s688876 sd688 sdf86