用sklearn的svm识别验证码
本帖最后由 小锟 于 2017-8-6 20:11 编辑最近想爬一下自己学校的教务系统,发现要输入验证码,用tesseractocr来识别发现准确率不高,于是想到了用机器学习来实现
发几张验证码
**** Hidden Message *****
最后训练完后发现单个字母的识别率为93%
一个验证码的识别率为75%
因为登陆时post请求发送的很快,所以这个成功率基本上已经可以很快的登陆了
因为禁止上传ipynb类型的文件,大家就看看代码吧
验证码的答案是自己手输的,可能会有错误
ipynb的txt文件改下后缀就可以用nootbook打开了 大神,学习学习! 不过我发现,你这个原来使用jupter notebook 写的,这样看起来很难懂啊。
直接把ipynb改个文件名就能上传了。 ooxx7788 发表于 2017-8-6 19:59
大神,学习学习!
我也是刚学,python那么优雅的语音给我写的那么难看,刚刚忘了上传验证码答案了,现在补上 ooxx7788 发表于 2017-8-6 20:05
不过我发现,你这个原来使用jupter notebook 写的,这样看起来很难懂啊。
直接把ipynb改个文件名就能上传 ...
谢谢啦,已经改好 小锟 发表于 2017-8-6 20:12
谢谢啦,已经改好
我也试过了,可以打开,完美!
我这还有我写的变态级(我肉眼都看不出来的)验证码生成器,你要不要试试啊! ooxx7788 发表于 2017-8-6 20:19
我也试过了,可以打开,完美!
我这还有我写的变态级(我肉眼都看不出来的)验证码生成器,你要不要试 ...
这个噪音太大了,二值化后感觉可以根据密度来或者比例来进行去噪音,至于要分成多少面积算一次密度,这也要算,目前还做不出来,哈哈哈 学习一下 zkamsk 发表于 2017-8-9 10:23
学习一下
我这个是分割4位的,五位的话分割方法要变一下,我研究了你的那3张图,有50列,后五列是空白的,也就是45列,五个数字正好平均分布,你可以这样分割 小锟 发表于 2017-8-9 10:40
我这个是分割4位的,五位的话分割方法要变一下,我研究了你的那3张图,有50列,后五列是空白的,也就是45 ...
关于图像之类的,我不太了解,刚开始学,请问这种切割什么的改怎么学? zkamsk 发表于 2017-8-9 10:42
关于图像之类的,我不太了解,刚开始学,请问这种切割什么的改怎么学?
图像是像素组成的,一整图片可以看成矩阵,也就是列表,列表怎么分割的就可以怎么分割,最好用Numpy库吧,速度快,操作简单 小锟 发表于 2017-8-9 10:47
图像是像素组成的,一整图片可以看成矩阵,也就是列表,列表怎么分割的就可以怎么分割,最好用Numpy库吧 ...
我刚找到了这样一篇博客,十分详细,刚好学学,十分感谢你,我的鱼C等级太低,没法加好友,这是我的QQ(2929754715),希望能加你为好友,向你多多请教
http://blog.csdn.net/frank_good/article/details/52251062 厉害 本帖最后由 xueyefengbao 于 2018-6-11 16:26 编辑
正好用到 xueyefengbao 发表于 2018-6-11 16:22
正好用到
好久没来鱼C了,能帮到你是我的荣幸 很好。 Hello World 学习学习 做失败了来学习一下
大神,学习学习!
页:
[1]
2