MrFish 发表于 2020-3-19 14:18:15

requests网页访问返回乱码?浏览器访问正常

本帖最后由 MrFish 于 2020-3-20 09:25 编辑

payload = {'net_type': '11111'}
response = requests.get(url=url, params=payload, headers=HEADRES, verify=False)
print(response.text)

python返回数据:
���R����
TRM��6�� ;N9�0 (l ,����s��]*>��=�.<�76�m�
�Ή�z���V�lp�q̷j4h�����*

浏览器返回数据是一个txt文本.

最初的想法:模拟网页访问,获得txt文本,解析该文本字符串,解码数据,得到配置信息。

六小鸭 发表于 2020-3-19 17:34:04

有点麻烦https://blog.csdn.net/weixin_42625143/article/details/98953990?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
(最佳答案~~)

MrFish 发表于 2020-3-20 09:29:17

六小鸭 发表于 2020-3-19 17:34
有点麻烦https://blog.csdn.net/weixin_42625143/article/details/98953990?depth_1-utm_source=distribute ...

感谢回复,非相同原因,目前已解决。

MrFish 发表于 2020-3-20 09:30:12

已经解决,
本问题中的乱码是网页编码的问题,网页默认返回的是压缩(compressed)数据,
解决方案:在Header中"Accept-Encoding": "gzip, deflate",#, br", #去掉 'br'标示,,去掉 br标示即可得到未压缩的文本文档。

页: [1]
查看完整版本: requests网页访问返回乱码?浏览器访问正常