鱼C论坛

 找回密码
 立即注册
查看: 1976|回复: 7

[已解决]验证码完成后如何带入网页

[复制链接]
发表于 2020-10-19 22:04:29 | 显示全部楼层 |阅读模式
5鱼币
本帖最后由 python羊 于 2020-10-21 12:01 编辑

要爬取  https://data.gia.edu/RDWB/Captch ... 40&APIno=1&   的数据。
因为有验证码,所以讲 验证码图片保存后,利用打码平台识别,再传回,但是在传回的时候需要  图片的身份ID,

现在我遇到的是,不知道如何 获取 验证码图片的 一个身份ID。就是最下面  Query 当中的  t  后面的字符   。如图:

最佳答案
2020-10-19 22:04:30

                               
登录/注册后可看大图

查看相关js文件 可以发现
        function f() {
            e(b.captchaEndpoint + "?get=script-include", {
                cache: !0
            }).done(function() {
                var c = a("#BDC_VCID_" + k).val();
                e(b.captchaEndpoint + "?get=init-script-include&c=" + k + "&t=" + c + "&cs=2").done(g)
            })
        }
        function c() {
            return a.ajax({
                method: "GET",
                url: b.captchaEndpoint,
                data: {
                    get: "html",
                    c: k
                }
            })
        }
对应的就是图上倒数第三个xhr请求
那你需要自己去发get请求 记得如图带参数 然后在返回中可以找到t
图片ID.jpg

最佳答案

查看完整内容

查看相关js文件 可以发现 对应的就是图上倒数第三个xhr请求 那你需要自己去发get请求 记得如图带参数 然后在返回中可以找到t
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-19 22:04:30 | 显示全部楼层    本楼为最佳答案   

                               
登录/注册后可看大图

查看相关js文件 可以发现
        function f() {
            e(b.captchaEndpoint + "?get=script-include", {
                cache: !0
            }).done(function() {
                var c = a("#BDC_VCID_" + k).val();
                e(b.captchaEndpoint + "?get=init-script-include&c=" + k + "&t=" + c + "&cs=2").done(g)
            })
        }
        function c() {
            return a.ajax({
                method: "GET",
                url: b.captchaEndpoint,
                data: {
                    get: "html",
                    c: k
                }
            })
        }
对应的就是图上倒数第三个xhr请求
那你需要自己去发get请求 记得如图带参数 然后在返回中可以找到t
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-20 13:23:06 | 显示全部楼层
利用session使得前后两次请求在一个session
大概流程
get网页 获取验证码
将验证码利用打码平台识别
post验证码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-10-21 11:36:58 | 显示全部楼层
mrcrisis 发表于 2020-10-20 13:23
利用session使得前后两次请求在一个session
大概流程
get网页 获取验证码

我也是这个思路,但是不知道如何获得 验证码图片 的ID。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-10-21 11:41:46 | 显示全部楼层
mrcrisis 发表于 2020-10-20 13:23
利用session使得前后两次请求在一个session
大概流程
get网页 获取验证码

我改成了具体的问题,请问一般这个 数据怎么获得。感谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-10-21 12:57:53 | 显示全部楼层
做爬虫还是了解一下前端比较好 至少html和js得看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-10-21 14:31:13 | 显示全部楼层
mrcrisis 发表于 2020-10-21 12:57
做爬虫还是了解一下前端比较好 至少html和js得看看

本来只想做一个简单的爬虫,一开始这个网站也没有验证码,谁知道越来越难。
感谢,感谢。还是需要多学。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-1-20 23:10:46 | 显示全部楼层
原理明白。完全复制代码还是失败了。谁知道原因
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-12 09:39

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表