自动识别并填写 V2EX 注册 / 登录 / 重设密码 等页面的验证码
V2EX 的验证码的设计在 阻挠肉眼识别 和 便于模式识别 两方面都达到了很高的水准。前者无需赘言,后者用之前项目做过的本地模式识别库简单测试,识别率非常高。
前者使这个功能成为一个迫切的需求,后者使自动识别成为技术上的可能,但还仅仅是可能。
但最重要的一点是,当验证码地址 _captcha?Once={number} 和 Cookie 不变的情况下,可以反复获取文字相同,但是重绘过的图片。
To build the project you need to run the following node commands:
npm install -g @angular/cli gulp
npm install
gulp
因为有 node-sass 的依赖,而 node-sass 又需要 node-gyp
node-gyp 在 Windows 上 Build 需要 Python 2.7 和 Visual C++ Build Tools
不想安装环境或者不想 Build 的,可以直接到 Release 下载扩展包,在 扩展页面 chrome://extensions/ 加载已解压的扩展程序即可。
![]() | 1 koodai 2017-11-28 00:41:49 +08:00 via Android 服!贵在思路 |
![]() | 2 freed 2017-11-28 01:06:34 +08:00 赞~ |
3 EchoChan 2017-11-28 01:08:10 +08:00 via Android 有意思,这验证码,虽然不算差,但体验真不好。 |
![]() | 4 zhigang1992 2017-11-28 01:55:23 +08:00 ![]() 阻挠肉眼识别 和 便于模式识别 lol |
![]() | 5 vipper 2017-11-28 07:33:25 +08:00 via iPhone 用这种是不是要比打码便宜很多 |
![]() | 6 wellsc 2017-11-28 09:00:23 +08:00 via iPhone |
7 ty89 2017-11-28 11:03:33 +08:00 v2 这种验证码就只能摆个样子,用投影法切分成单个字符再稍微调整尺寸和位置,再丢给 ocr 就搞定了。 防机器识别最重要的几点统统不具备: 1 )字体重叠粘连 2 )背景干扰 3 )字体扭曲 |
![]() | 8 dotpig 2017-11-28 12:49:38 +08:00 “阻挠肉眼识别” 和 “便于模式识别” 的意思是不是给真人麻烦,给机器人方便的意思? |
![]() | 9 SoloCompany 2017-11-28 12:52:55 +08:00 via iPhone 然而我只用 gg 登录 |
![]() | 10 myself659 2017-11-28 14:37:44 +08:00 验证码影响用户体验,又解决不爬虫 是不是可以被淘汰了 |
![]() | 11 soulmine 2017-11-28 20:40:26 +08:00 @myself659 不是 至少有了验证码会让很大一部分写爬虫的感觉很日狗 说不定就跳过了 至少我是这样 当然假如什么非爬不可的 就另说了 www |
![]() | 12 AnyISalIn 2017-11-29 10:49:10 +08:00 思路不错 |