鱼C论坛

 找回密码
 立即注册
查看: 1716|回复: 19

[已解决]求助!关于图形验证码的识别方法

[复制链接]
发表于 2020-7-19 14:41:01 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
类似这种验证码,通过Tesseract-OCR,无论将图片怎么调整,都不能识别。

求大神告知好的图形验证码识别方法,因为需求网站的图形验证码很简单,所以希望获取验证码的方法越简单越好。
test.png
最佳答案
2020-7-19 22:57:48
飘花飞雪 发表于 2020-7-19 22:56
.point不也是二值化处理吗?你这是哪个模块的函数

好吧,可能没注意到,我无能为力了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-7-19 14:45:42 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 15:02:56 | 显示全部楼层
Hello. 发表于 2020-7-19 14:45
传送门1
传送门2
传送门3(推荐)

老哥,推荐的那个识别不了这个数字验证码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-19 15:03:26 | 显示全部楼层
飘花飞雪 发表于 2020-7-19 15:02
老哥,推荐的那个识别不了这个数字验证码

还有俩
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 15:06:26 | 显示全部楼层
Hello. 发表于 2020-7-19 14:45
传送门1
传送门2
传送门3(推荐)

调整了阈值已经很清晰了,但是识别不出来
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 15:07:18 | 显示全部楼层
  1. from PIL import Image
  2. import pytesseract
  3. import cv2
  4. from urllib.request import urlretrieve


  5. pytesseract.pytesseract.tesseract_cmd = r"F:\Program Files (x86)\Tesseract-OCR\tesseract.exe"

  6. urlretrieve("http://wt.yygjj.com.cn/captcha.jpg","test.jpg")

  7. image = Image.open("test.jpg")

  8. image = image.convert("L")

  9. threshold = 135

  10. table = []

  11. for i in range(256):
  12.     if i < threshold:
  13.         table.append(0)
  14.     else:
  15.         table.append(1)

  16. # image = cv2.imread("test.jpg",cv2.IMREAD_GRAYSCALE)
  17. # #
  18. # cv2.imwrite('newimage.png', image)

  19. #image = cv2.imread("C:/Users/fengz/Desktop/123.jpg",cv2.IMREAD_GRAYSCALE)

  20. #gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
  21. # cv2.imshow("aaa",image)
  22. # cv2.waitKey(0)  # 单位毫秒
  23. # #
  24. # cv2.destroyAllWindows()
  25. # cv2.destroyWindow("bug")

  26. # cv2.imwrite('newimage.png', image)
  27. #

  28. image = image.point(table,"1")
  29. image.show()
  30. text = pytesseract.image_to_string(image)
  31. #

  32. print(text)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-19 15:07:38 | 显示全部楼层
飘花飞雪 发表于 2020-7-19 15:06
调整了阈值已经很清晰了,但是识别不出来

连打印都打印不出来?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 15:07:53 | 显示全部楼层
Hello. 发表于 2020-7-19 14:45
传送门1
传送门2
传送门3(推荐)

老哥,我粘贴了代码,你能帮忙运行试试吗?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 15:08:32 | 显示全部楼层
Hello. 发表于 2020-7-19 15:07
连打印都打印不出来?

打印不出来,CMD里面直接运行也识别不出来
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-19 15:13:46 | 显示全部楼层
不行哈哈,你看下第二篇
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 15:16:42 | 显示全部楼层
Hello. 发表于 2020-7-19 15:13
不行哈哈,你看下第二篇

我试试
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 15:17:51 | 显示全部楼层
Hello. 发表于 2020-7-19 15:13
不行哈哈,你看下第二篇

和第三篇差不多,方法我都试了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-19 15:19:48 | 显示全部楼层
本帖最后由 Hello. 于 2020-7-19 15:22 编辑

好像没看到你二值化
  1. img = binarizing(imgry,130)       #二值化
复制代码


再看看这个
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 22:56:50 From FishC Mobile | 显示全部楼层
Hello. 发表于 2020-7-19 15:19
好像没看到你二值化



.point不也是二值化处理吗?你这是哪个模块的函数
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-19 22:57:48 | 显示全部楼层    本楼为最佳答案   
飘花飞雪 发表于 2020-7-19 22:56
.point不也是二值化处理吗?你这是哪个模块的函数

好吧,可能没注意到,我无能为力了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 22:59:20 From FishC Mobile | 显示全部楼层
Hello. 发表于 2020-7-19 15:19
好像没看到你二值化



这一篇我也看了,测试网站的图形码不做二值化也能读出来
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-19 23:00:36 | 显示全部楼层
飘花飞雪 发表于 2020-7-19 22:59
这一篇我也看了,测试网站的图形码不做二值化也能读出来

哈哈,二值化会更清晰
我有个处理图片的代码,你要不要看一看(虽然可能没啥用)
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 23:01:42 From FishC Mobile | 显示全部楼层
好的,我参考一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-7-19 23:01:53 | 显示全部楼层
  1. # -*- coding:utf-8 -*-


  2. import cv2
  3. import numpy as np
  4. from tkinter import filedialog, Tk
  5. from os import getcwd
  6. from re import findall


  7. def open_path():
  8.     # 图片路径
  9.     root = Tk()
  10.     root.withdraw()
  11.     file_path = (filedialog.askopenfilename(title='选择图片文件', filetypes=[('All Files', '*')]))
  12.     return file_path


  13. def dodgeNaive(image, mask):
  14.     # determine the shape of the input image
  15.     width, height = image.shape[:2]

  16.     # prepare output argument with same size as image
  17.     blend = np.zeros((width, height), np.uint8)

  18.     for col in range(width):
  19.         for row in range(height):
  20.             # do for every pixel
  21.             if mask[col, row] == 255:
  22.                 # avoid division by zero
  23.                 blend[col, row] = 255
  24.             else:
  25.                 # shift image pixel value by 8 bits
  26.                 # divide by the inverse of the mask
  27.                 tmp = (image[col, row] << 8) / (255 - mask)
  28.                 # print('tmp={}'.format(tmp.shape))
  29.                 # make sure resulting value stays within bounds
  30.                 if tmp.any() > 255:
  31.                     tmp = 255
  32.                     blend[col, row] = tmp

  33.     return blend


  34. def dodgeV2(image, mask):
  35.     return cv2.divide(image, 255 - mask, scale=256)


  36. def burnV2(image, mask):
  37.     return 255 - cv2.divide(255 - image, 255 - mask, scale=256)


  38. def rgb_to_sketch(src_image_name):
  39.     print('转换中......')
  40.     img_rgb = cv2.imread(src_image_name)
  41.     img_gray = cv2.cvtColor(img_rgb, cv2.COLOR_BGR2GRAY)
  42.     # 读取图片时直接转换操作
  43.     # img_gray = cv2.imread('example.jpg', cv2.IMREAD_GRAYSCALE)

  44.     img_gray_inv = 255 - img_gray
  45.     img_blur = cv2.GaussianBlur(img_gray_inv, ksize=(21, 21),
  46.                                 sigmaX=0, sigmaY=0)
  47.     img_blend = dodgeV2(img_gray, img_blur)

  48.     # cv2.imshow('original', img_rgb)
  49.     # cv2.imshow('gray', img_gray)
  50.     # cv2.imshow('gray_inv', img_gray_inv)
  51.     # cv2.imshow('gray_blur', img_blur)
  52.     cv2.imwrite(dst_image_name, img_blend)
  53.     save_path = getcwd() + "\" + dst_image_name  # 保存路径
  54.     print('转换完成!!!\n')
  55.     print('保存路径:' + save_path)
  56.     cv2.imshow(save_path, img_blend)
  57.     cv2.waitKey(0)
  58.     cv2.destroyAllWindows()


  59. if __name__ == '__main__':
  60.     print('请选择图片,路径不要含中文:')
  61.     src_image_name = open_path()  # 文件路径
  62.     print(src_image_name+'\n')
  63.     image_name = ''.join(findall(r'[^\\/:*?"<>|\r\n]+, src_image_name))  # 获取文件名
  64.     dst_image_name = 'Sketch_' + image_name
  65.     rgb_to_sketch(src_image_name)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-7-19 23:02:30 From FishC Mobile | 显示全部楼层
Hello. 发表于 2020-7-19 23:00
哈哈,二值化会更清晰
我有个处理图片的代码,你要不要看一看(虽然可能没啥用)

谢谢了,我参考一下
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-23 21:41

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表