
1 mikawudi 2013-06-30 16:57:25 +08:00 和语言没啥关系,主要是看看图像处理方面的东西吧,验证码就不用做边缘检测了,简单的二值化处理下,然后分割一下,每个分割出来的数字(字母)的每个像素和标准的数字(字母)图像的每个像素点做异或运算,然后统计下和哪个标准数字(字母)图像的相似度最高,就是那个数字(字母)了....不过要考虑干扰噪点啊,干扰线啊什么的,然后如果生成验证码的时候用了旋转啊什么的那么就很难匹配了....我只用C#做过简单实验....不过思路大概就是这样的吧 |
3 andyhu 2013-07-02 20:52:59 +08:00 也可以直接deathbycaptcha人力解决 |
5 ufo22940268 2013-07-03 08:18:02 +08:00 |
6 justin1989 2013-07-03 09:25:17 +08:00 验证码里如果有扭曲和重叠,程序就基本搞不定了 |
7 VYSE 2013-07-03 09:40:28 +08:00 试过tesseract这类OCR,对验证码基本无解,除非针对某类特殊优化 |