鱼C论坛

 找回密码
 立即注册
查看: 1172|回复: 4

[已解决]求助,关于使用get发送请求时需携带header的问题

[复制链接]
发表于 2022-5-16 12:54:50 | 显示全部楼层 |阅读模式
60鱼币
目前在尝试爬一个网站
网页链接 = https://cattendee.abstractsonlin ... &searchId=70400
我需要爬取的数据url 是 :https://www.abstractsonline.com/ ... ort=1&order=asc

代码如下
  1. import requests

  2. url = 'https://www.abstractsonline.com/oe3/Program/10517/Search/70400/Results?page=1&pagesize=25&sort=1&order=asc'
  3. Backpack = 'af5bbcda-ef07-458b-9e74-1c02913eed0c'

  4. headers = {
  5.             'Accept': 'application/json',
  6.             'Backpack': Backpack,         #这是身份认证,网站每天会更新,须去网页复制获取
  7.             'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36',
  8.             }

  9. res = requests.session()
  10. response = res.get(url, headers=headers, timeout=3)
复制代码


使用get发送请求需要携带一些header,其中的 Backpack = 'af5bbcda-ef07-458b-9e74-1c02913eed0c'
他在网页的这个位置

但这个他是每天会变化的。1、有什么办法可以在通过代码自动获取的到Backpack?2、在网页上的数据包除了第一个数据包,其它的包请求头基本上都带了这个参数,这些数据包是怎么获取到这个参数写进请求头里的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-5-16 12:54:51 | 显示全部楼层    本楼为最佳答案   
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-5-16 22:30:12 | 显示全部楼层
我找到了获取这个数据包了 微信截图_20220516125007.png
url = 'https://www.abstractsonline.com/oe3/Backpack/create'

这数据包是给POST请求,但是发送请求都是的到400反馈
headers 和data 都是搬得抓到的包的来用,但一样是400反馈,求大神帮忙看看问题在哪
  1. import requests
  2. # headers = { 'Accept': 'application/json',
  3. #             'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/100.0.4896.127 Safari/537.36'}

  4. headers1 = {
  5. 'Accept': 'application/json',
  6. 'Accept-Encoding': 'gzip, deflate, br',
  7. 'Accept-Language': 'zh-CN,zh;q=0.9,en;q=0.8,en-GB;q=0.7,en-US;q=0.6',
  8. 'caller': 'debug',
  9. 'Connection': 'keep-alive',
  10. 'Content-Length': '62',
  11. 'Content-Type': 'application/json',
  12. 'Host': 'www.abstractsonline.com',
  13. 'Origin': 'https://cattendee.abstractsonline.com',
  14. 'Referer': 'https://cattendee.abstractsonline.com/',
  15. 'sec-ch-ua': '" Not A;Brand";v="99", "Chromium";v="101", "Microsoft Edge";v="101"',
  16. 'sec-ch-ua-mobile': '?0',
  17. 'sec-ch-ua-platform': '"Windows"',
  18. 'Sec-Fetch-Dest': 'empty',
  19. 'Sec-Fetch-Mode': 'cors',
  20. 'Sec-Fetch-Site': 'same-site',
  21. 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.47',
  22. }

  23. url1 = r'https://www.abstractsonline.com/oe3/Backpack/create'
  24. data = {"Username":"backpack","Password":"89j34jks98cnjks989p;nfs44"}

  25. res = requests.session()
  26. response = res.post(url1, headers=headers1, timeout=3, data=data)





复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-5-16 22:40:52 | 显示全部楼层
非凡 发表于 2022-5-16 22:30
我找到了获取这个数据包了
url = 'https://www.abstractsonline.com/oe3/Backpack/create'

微信截图_20220516125007.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-5-16 22:42:04 | 显示全部楼层

已经解决了~~~~
由于悬赏不能给自己,那我把悬赏给第一个回复我的人吧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-20 01:54

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表