小白100000000 发表于 2020-12-13 18:12:26

无法识别验证码

#!/usr/bin/python
# -*- coding: UTF-8 -*-

from PIL importImage
import tesserocr
import tessdata
from selenium import webdriver

br = webdriver.Chrome()

def yzm_sb():
    br.get('http://www.jjytkd.com/admin/login.asp')
    img = br.find_element_by_tag_name('img')
    img = img.screenshot('xxx.png')
    img = Image.open('0.png')
    img = img.convert('L')
    count = 200
    table=[]
    for i in range(256):
      if i < count :
            table.append(0)
      else:
            table.append(1)
    img = img.point(table,'1')
    img.show()

    res = tesserocr.image_to_text(img)

    print(res)
yzm_sb()

不知是什么问题验证码打印结果为空,没识别出来这是为什么呀该怎么解决

YunGuo 发表于 2020-12-13 19:22:10

本帖最后由 YunGuo 于 2020-12-13 20:45 编辑

你确定你这代码每次都能获取到验证码图片?如果连图片都获取不到,识别什么?
另外这个验证码图片太小,试试放大后再处理识别,阈值需要自己调整找到合适的。
总之使用tesseract-ocr识别成功率比较低。
页: [1]
查看完整版本: 无法识别验证码