|
60鱼币
爬取url:http://www.qybz.org.cn/standardProduct/toAdvancedResult.do
提取 该搜索网页的搜索结果,如图》:企业名称,标准名称,发布时间,状态。
最终网站 为 post表单格式的。
表单中 :geetest_challenge,geetest_validate,geetest_seccode。三个参数为动态值。
目前卡在 :获取geetest_challenge参数。
该地址应该返回 geetest_challenge 的值。但是一直是 错误,无法获取返回值。
请问应该如何做,才能获取 geetest_challenge 的值。
源代码————————
import requests
import json
import time
header={
'Referer': 'http://www.qybz.org.cn/standardProduct/toAdvancedResult.do',
'User-Agent':'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Mobile Safari/537.36',}
#_______获取challenge 参数
url_t = 'http://www.qybz.org.cn/gc/geetest/query?t=1625710079856'
response = requests.get(url_t, headers = header)
t_dict = json.loads(response.text)
print(t_dict['challenge'],t_dict['gt'])
#_______获取geetest_challenge参数
call_time = 'geetest_'+str(int(round(time.time() * 1000)))
params={
'is_next':'true',
'type':'slide3',
'gt':t_dict['gt'],
'challenge': t_dict['challenge'],
'lang': 'zh-cn',
'https': 'false',
'protocol': 'http://',
'offline': 'false',
'product': 'embed',
'api_server': 'api.geetest.com',
'isPC': 'true',
'autoReset': 'true',
'width': '100%',
'callback':call_time}
url_chan='http://api.geetest.com/get.php?'
response_chan = requests.get(url_chan, headers = header,params=params)
print(response_chan.text)
chan_dict = json.loads(response_chan.text)
print(chan_dict['challenge'])
|
-
|