requests网页访问返回乱码?浏览器访问正常
本帖最后由 MrFish 于 2020-3-20 09:25 编辑payload = {'net_type': '11111'}
response = requests.get(url=url, params=payload, headers=HEADRES, verify=False)
print(response.text)
python返回数据:
���R����
TRM��6�� ;N9�0 (l,����s��]*>��=�.<�76�m�
�Ή�z���V�lp�q̷j4h�����*
浏览器返回数据是一个txt文本.
最初的想法:模拟网页访问,获得txt文本,解析该文本字符串,解码数据,得到配置信息。 有点麻烦https://blog.csdn.net/weixin_42625143/article/details/98953990?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
(最佳答案~~) 六小鸭 发表于 2020-3-19 17:34
有点麻烦https://blog.csdn.net/weixin_42625143/article/details/98953990?depth_1-utm_source=distribute ...
感谢回复,非相同原因,目前已解决。 已经解决,
本问题中的乱码是网页编码的问题,网页默认返回的是压缩(compressed)数据,
解决方案:在Header中"Accept-Encoding": "gzip, deflate",#, br", #去掉 'br'标示,,去掉 br标示即可得到未压缩的文本文档。
页:
[1]