鱼C论坛

 找回密码
 立即注册
查看: 1767|回复: 3

[已解决]如何跳过验证码

[复制链接]
发表于 2020-9-21 22:52:54 | 显示全部楼层 |阅读模式
20鱼币
在这个网页爬数据的时候,需要验证码,请问遇到验证码应该如何处理。
不输入验证码 直接爬取网页中的  ‘VS’。

代码(鱼友:疾风怪盗 提供):

import re,time,json
from selenium import webdriver
driver=webdriver.Chrome()

url = 'https://data.gia.edu/RDWB/Captcha.jsp?reportno=6352100549&cc=CN&APIno=1&'
driver.get(url)
time.sleep(10)
html_str=driver.page_source
print(html_str)
pattren="event.source.postMessage\(\'(.*?)\',event.origin"
data=re.findall(pattren,html_str)
print(data[0])
data=json.loads(data[0])
print(data['CLARITY_GRADE'])
最佳答案
2020-9-21 22:52:55
你咋又开一贴。。。。。。
验证码
要么像我用的selenium,自己输入
要么用图像识别技术,先获取验证码图片,识别出数字字母,再自动输入,但是这个要求比较高,百度、阿里应该都有这份方面的接口
好像还有个叫云打码的平台,是专门搞验证码的,收费的,不过不太贵
其他办法就不知道了
Inkedgia图片_LI_Moment.jpg

最佳答案

查看完整内容

你咋又开一贴。。。。。。 验证码 要么像我用的selenium,自己输入 要么用图像识别技术,先获取验证码图片,识别出数字字母,再自动输入,但是这个要求比较高,百度、阿里应该都有这份方面的接口 好像还有个叫云打码的平台,是专门搞验证码的,收费的,不过不太贵 其他办法就不知道了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-21 22:52:55 | 显示全部楼层    本楼为最佳答案   
你咋又开一贴。。。。。。
验证码
要么像我用的selenium,自己输入
要么用图像识别技术,先获取验证码图片,识别出数字字母,再自动输入,但是这个要求比较高,百度、阿里应该都有这份方面的接口
好像还有个叫云打码的平台,是专门搞验证码的,收费的,不过不太贵
其他办法就不知道了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-22 10:34:33 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-9-22 16:34:07 | 显示全部楼层
云打码吧,一次1-几分钱,图像识别不好用,一般都识别不了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-18 15:47

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表