塞在背包里的人 发表于 2020-5-28 09:53:21

请问大家这种跳出来的验证码在爬虫时如何解决,万分感谢

qiuyouzhi 发表于 2020-5-28 09:55:10

selenium

Twilight6 发表于 2020-5-28 09:56:18

应该可以审核元素里找验证码的图片url把他爬下来,然后自己在看图片输入验证吧

塞在背包里的人 发表于 2020-5-28 10:00:18

qiuyouzhi 发表于 2020-5-28 09:55
selenium

请问大佬可以看一下这个网站吗https://sn.122.gov.cn/#/viopub,它的验证码类型也会变化,开始是计算后来又变成滑行了

qiuyouzhi 发表于 2020-5-28 10:03:45

塞在背包里的人 发表于 2020-5-28 10:00
请问大佬可以看一下这个网站吗https://sn.122.gov.cn/#/viopub,它的验证码类型也会变化,开始是计算后来 ...

我有一个想法,你用selenium
搞到验证码那个界面之后,sleep几秒,然后你手动输入验证码。

永恒的蓝色梦想 发表于 2020-5-28 10:04:37

塞在背包里的人 发表于 2020-5-28 10:00
请问大佬可以看一下这个网站吗https://sn.122.gov.cn/#/viopub,它的验证码类型也会变化,开始是计算后来 ...

爬government网站,牛13

老八秘制 发表于 2020-5-28 10:10:48

永恒的蓝色梦想 发表于 2020-5-28 10:04
爬government网站,牛13

这不会判刑么{:10_277:}

塞在背包里的人 发表于 2020-5-28 10:13:06

永恒的蓝色梦想 发表于 2020-5-28 10:04
爬government网站,牛13

爬取公开的仅用作个人数据分析,应该可以吧

Twilight6 发表于 2020-5-28 10:14:11

塞在背包里的人 发表于 2020-5-28 10:13
爬取公开的仅用作个人数据分析,应该可以吧

信息公开的 没问题,只是数据别拿去非法使用即可,而且别爬太猛,服务器给你搞垮,那不判也难

suchocolate 发表于 2020-5-28 11:37:01

验证码的图下载后可以用tesserocr识别(安装比较麻烦),也可以用免费的百度AI提供的识别:https://ai.baidu.com/tech/ocr/general
页: [1]
查看完整版本: 请问大家这种跳出来的验证码在爬虫时如何解决,万分感谢