bravsheng 发表于 2021-8-28 18:50:03

求教:我想爬登录系统进行指定资料的下载,但我卡在登录这块

本帖最后由 bravsheng 于 2021-8-29 09:28 编辑

我想重写date字典,但是看了下network里面没找到date数据,我不知道账号密码前面对应的key是在哪找的?
我们系统对应的验证码是一个数字计算结果,怎么才能做到自动登录到系统,然后进行下一步的数据爬取工作?
求鱼油指点!

代码:
import urllib.request
from http.cookiejar import CookieJar
import json

loginurl = 'http://epms.jscmcc.cn/pages/common-v4/home-manager.aspx'

url = 'http://epms.jscmcc.cn/pages/common-v4/loginV2.aspx'

cookie = CookieJar()
opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))

headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) \
         AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 \
         Safari/537.36'}

# 表单提交参数设置
data = {
'ck':'',
'name':'高远',
'password':'_I@60^Zh',
'remember':'false',
'ticket':''
}
# get请求的request
req_get = urllib.request.Request(url,headers=headers)
# post请求的request
req_post = urllib.request.Request(loginurl,urllib.parse.urlencode(data).\
                            encode('utf-8'),headers)
# get请求的response
res_get = opener.open(req_get)
# post请求的response
res_post = opener.open(req_post)

res_html = res_post.read().decode('utf-8')

# json解码
res_js = json.loads(res_html)
# 根据status的值判断是否登录成功
if res_js['status'] == 'success':
    print('登录成功')
else:
    print('登录失败')

路神 发表于 2021-8-28 19:06:16

直接复制登入后的cookie省事

南归 发表于 2021-8-28 19:46:18

看你写的代码,还有豆瓣的网站?是想照葫芦画瓢吗...

南归 发表于 2021-8-28 19:47:06

表单数据
__EVENTTARGET:
__EVENTARGUMENT:
__VIEWSTATE: r46MU5MvBZnuqqyvL7JLfiU0HadoN97noftx+yuw9jBsmkiM8uig8TKdKIo/e1a9OOLxYL/hWluCGgiTgMDbPVbg9XcBfNniZ5gUb9Q5yFwoDOxizvy/u24OmTASg+7TGCT+sWWGQASQSyiNMQ2DQ68tKLBONAmmDrzbLXH8dNYbwnNj0yk7K3JSzqpGg4GWQ8yY/A==
__EVENTVALIDATION: 2zCmYVR664paNo6nl/LRlaGcnfaOQXSVJ9EiEnExc0bvptaaNq1ppN+qOsUy9XprZpFQJ8UzxFJqynP+HuHAB0+ZlFOL2/SkCKSbxJy4e/KiCBjt3ewKgsHRlAV+Fb5WZPSvf+lTum8gnlZhJyN2N99Eg5BgXd1ieHhXfsNQ+60NfKjoDY3SP0dVRJ6TtfVgySSBTLqn0C80y89v7xTmXhvmYf3uhDQMZ8uBRguZTFMSqLjlmuQLIsGX7mXlNyiE1Ig3QtaoLQc3UkZ1tuipse38yxgwQ/rUpKFUj6YAnc2mu64b
guid: 80076d1e-2caa-4014-ba15-02a12da532df
txtLoginName: 高远
enter: rbStaticPwd
txtPwd: aOkD03BADU3N9HBz/8mGMeT0+GK/SuNxm5EK6Xzfw5w8bi79bw+JsaOyur0JcyyRpfjA8SHRjwlg9bVnk5srlFqseD2vrOWdoiIEo3nMUeAhShOJcbw+plADjbX6U9lpp4MoJnsfXbwlQtksHI+j6a1aMVKN8ywedG1jyncRbCE=
txtValiCode: 22
btnLogin:

南归 发表于 2021-8-28 19:52:18

https://www.hualigs.cn/image/612a2363c31eb.jpg

bravsheng 发表于 2021-8-29 09:19:55

本帖最后由 bravsheng 于 2021-8-29 09:26 编辑

南归 发表于 2021-8-28 19:46
看你写的代码,还有豆瓣的网站?是想照葫芦画瓢吗...

{:5_109:}对对,最近刚学完那课,我是想直接在那程序基础上改,试试能不能上去。噢,这个url我忘改了!

bravsheng 发表于 2021-8-29 09:21:38

本帖最后由 bravsheng 于 2021-8-29 11:37 编辑

路神 发表于 2021-8-28 19:06
直接复制登入后的cookie省事

{:5_105:}噢,还可以这样操作呀!感谢!

南归 发表于 2021-8-29 10:02:19

bravsheng 发表于 2021-8-29 09:19
对对,最近刚学完那课,我是想直接在那程序基础上改,试试能不能上去。噢,这个url我忘改了 ...

要理解,然后再写,每个网页不一样要具体分析

bravsheng 发表于 2021-8-29 11:32:21

南归 发表于 2021-8-29 10:02
要理解,然后再写,每个网页不一样要具体分析

哦哦,谢谢!明白了!登录后看到了表单
页: [1]
查看完整版本: 求教:我想爬登录系统进行指定资料的下载,但我卡在登录这块