这两天冲顶大会之类的直播答题 APP 突然火了起来,不得不佩服互联网公司的想象力,那么程序员怎么用不同的方式玩转答题游戏呢。之前微信的跳一跳小游戏刷报朋友圈,已经有很多朋友写出了自动化的脚本辅助,一看到答题游戏就马上想到可以用类似的方式来写一个简单的脚本。我发现已经有朋友做了个调用百度 api 的,自己就再写个直接用识别库的吧,代码思路简单,可以用在各类答题游戏中。使用文字识别加搜索,只能辅助增加准确率,保证不了全对。
目前版本增加了截图传输效率,修改了识别参数,对图像进行灰度转化,去干扰增加了识别准确率。结果判断使用了三种方式,对不同问题可以参考不同结果。
具体代码和环境及使用请戳: https://github.com/Skyexu/TopSup
adb shell screencap -p /sdcard/screenshot.png adb pull /sdcard/screenshot.png .
文字识别两个方法:
直接打开浏览器搜索问题
题目+每个选项都通过浏览器进行搜索,从网页代码中提取搜索结果计数
只用题目搜索结果页面代码中包含选项的词频计数法
以下为两个示例结果,可以看出下面两道题,两个方法有不同的结果,可以更具问题类型进行不同的决策。
参考了 I Hacked HQ Trivia But Here ’ s How They Can Stop Me
写完简单版本想一想,怕是还没有 Hi ,Siri
来的方便,不过好在识别准确,查询快,后来又加了几个方法辅助决策。不玩了,写 paper 去了
![]() | 1 cnwtex 2018-01-10 02:13:33 +08:00 10 秒够用? |
![]() | 2 binux 2018-01-10 03:00:32 +08:00 知识图谱技术突飞猛进 |
3 ysanne 2018-01-10 03:03:48 +08:00 搞了个 Java 版的,大概 4s 左右可以跑完。不过有的问题比较难弄,比如生僻字读音之类的。 |
![]() | 4 qfdk PRO 这是高科技啊 不过 技术研究研究就好了 免得丧失公平性 |
5 chenqh 2018-01-10 05:58:15 +08:00 感觉自己好菜.. |
![]() | 6 sutking 2018-01-10 08:14:26 +08:00 via iPhone 感觉“以下选项那个符合 /是……”这类问题就坑了 |
![]() | 7 marlboros 2018-01-10 08:19:49 +08:00 ![]() 科技使人进步,有时候科技也会使人退步!!! 那些题,比最后获得的钱更具有价值!!! 出了这类辅助,可悲可悲!!! |
![]() | 8 sm1314 2018-01-10 08:24:11 +08:00 to 楼上,能用搜索引擎简单搜到的不算什么有价值的知识吧 |
![]() | 10 LanAiFaZuo 2018-01-10 08:56:50 +08:00 @ysanne 大佬 可以给我看看你的 java 版吗。最近在学习 java~~ |
![]() | 11 Solix 2018-01-10 09:00:22 +08:00 via iPhone 目测要上新闻了 |
![]() | 12 yuanfnadi 2018-01-10 09:08:42 +08:00 via iPhone @LanAiFaZuo java 代码不超过 20 行。自己研究一下 很简单的 |
![]() | 13 beimenjun PRO 我说这类网游你们有必要用外挂做外挂吗? 如果说是挑战技术还能理解,这个稍微核心的部分都不别人做的,这种外挂做得真的有意思吗? |
![]() | 14 LanAiFaZuo 2018-01-10 09:34:42 +08:00 @yuanfnadi 新手,只是想研究下~并不会。。 |
15 ylsc633 2018-01-10 09:42:50 +08:00 这个冲顶大会... 感觉里面应该有很多机器人! 然后实际发放的 有几十万? 肯定木有 |
![]() | 16 vipper 2018-01-10 10:27:59 +08:00 感谢,小米 6 测试成功。 有遇到些坑:刚开始没有找到 chi_sim.traineddata 文件,最后重新安装选择了中文,就可以了 |
![]() | 18 SkyeX OP @ylsc633 可能是吧,一般全答对也就每个人十几块钱,有时候多一点几十块,APP 完全和国外的一个一样啊,不知道是什么情况 |
![]() | 22 SkyeX OP @marlboros 不是很理解你的想法。这个原理也就是百度一下题目,我不会做百度一下没问题吧,也就是玩玩。说到题目价值,即使是答题真人秀很多也是背的题库吧。这些 APP 出现也就是为了刷流量,做题增长知识提升效果也没多大吧。。。。 |
23 ljbljb007 2018-01-10 11:42:14 +08:00 pip install PIL 这个安装不上啊 提示 Could not find a version that satisfies the requirement PIL (from versions: ) No matching distribution found for PIL 怎么搞? |
24 ysanne 2018-01-10 11:47:59 +08:00 @LanAiFaZuo 公司电脑写的,并不能挂到 github 上。 |
25 ysanne 2018-01-10 11:48:51 +08:00 楼主你的代码耗时怎么样?我这边 adb 截图 1s,ocr1s,google 大概 2s。时间上还是有点紧。 |
28 ljbljb007 2018-01-10 12:21:18 +08:00 好用了 谢谢楼主 不过方法 2 好用 方法 3 不好用 可以自己把方法 3 删掉吗? |
![]() | 30 huijian222 2018-01-10 12:34:02 +08:00 @yuanfnadi #26 可是。。真的能全对吗。。 |
![]() | 35 jason19659 2018-01-10 13:41:21 +08:00 @jamev5 #33 methods.py 里面改一下 from urllib.request import quote 然后 'https://baidu.com/s?wd=' + quote(question) |
![]() | 36 sangmong 2018-01-10 13:59:18 +08:00 马克思 |
![]() | 37 moxiaonai 2018-01-10 15:18:43 +08:00 有点慢 |
38 cdwyd 2018-01-10 16:37:50 +08:00 via Android |
![]() | 39 NicholasYX 2018-01-10 16:40:05 +08:00 请问如何找坐标?我想用它来搜头脑王者的题试一下 |
![]() | 40 qwjhb 2018-01-10 16:41:51 +08:00 @NicholasYX 截图用画图都可以把 |
![]() | 41 pheyer 2018-01-10 17:15:22 +08:00 看到 ocr 我很想笑 |
42 imyip 2018-01-10 18:53:29 +08:00 再加个识别然后模拟点击? adb shell input tap x y |
![]() | 43 qsnow6 2018-01-10 19:01:17 +08:00 via iPhone 直接抓包就好了 |
45 MonoLogueChi 2018-01-10 20:53:32 +08:00 via Android @marlboros 科技发明都是人类为了偷懒而创造的,没有偷懒的欲望,就没有发明创造的动力。所以说偷懒使人类进步 |
46 18912017465 2018-01-10 22:14:53 +08:00 用截图+ocr 的方式,时间上肯定来不及,效率太低了。我的想法是后台抓包得到问题,然后进行百度分析,同事记录进数据库,随着数据库的充实,得到问题后可以现在数据库里比对,没有再百度 |
![]() | 47 yuanfnadi 2018-01-10 23:35:29 +08:00 via iPhone @18912017465 你只是就知道了,题目是和视频流一起来的。 ocr 可以同时解决任何 app 任何平台,而且不会被破解。 |
49 XiaolinLeo 2018-01-11 00:15:51 +08:00 via iPhone |
![]() | 50 SorryChen 2018-01-11 00:16:37 +08:00 via iPhone 分选项搜的那里很耗时,建议用多线程,我用多线程之后,提速效果显著 |
![]() | 52 Linxing 2018-01-11 01:22:58 +08:00 所以楼主瓜分了那笔钱了吗 |
53 alinwu05 2018-01-11 07:51:25 +08:00 via Android macOS 打开浏览器搜索,关键词乱码怎么解决? |
![]() | 56 siriussilen 2018-01-11 11:19:08 +08:00 这个我也写了一个 python 脚本,我用的是阿里的 ocr 识别技术,不过识别技术不够高,准确率比较差 |
57 ljbljb007 2018-01-11 13:38:09 +08:00 新版本有问题 昨天的版本好用 |
58 ljbljb007 2018-01-11 13:43:13 +08:00 Traceback (most recent call last): File "GetQuestionTessAndroid.py", line 33, in <module> m2 = Thread(methods.run_algorithm(1, question, choices)) File "E:\downloads\TopSup-master\common\methods.py", line 76, in run_algorithm open_webbrowser_count(question, choices) File "E:\downloads\TopSup-master\common\methods.py", line 30, in open_webbrowser_count output(choices, counts) File "E:\downloads\TopSup-master\common\methods.py", line 48, in output counts = list(map(int, counts)) ValueError: invalid literal for int() with base 10: 'html><html><body>\r\n<script type="text/Javascript">\r\n var u = document.URL;\r\n var ua = navigator.userAgent.toLowerCase();\r\n var u = "https://www.baidu.com/s?"+qs(\'wd|word\')+\'&tn=02 提示这个 怎么整? |
59 yao978318542 2018-01-11 17:59:59 +08:00 e ...我写了个 php 版本的 命中率 80 左右 有的还是得自己判断啊。。。。。 |
![]() | 60 Bresh 2018-01-12 02:12:16 +08:00 via Android 这东西感觉还是人多力量大 毕竟三个臭皮匠顶个诸葛亮 去一些 yy 或者群里 一起玩 |
![]() | 61 q358566385 2018-01-17 18:33:16 +08:00 import urllib.parse ImportError: No module named parse 这个怎么破? Pyhton2 和 3 都安装了 |
![]() | 62 SkyeX OP @q358566385 使用 python3 运行 |