鱼C论坛

 找回密码
 立即注册
查看: 958|回复: 5

requests 请求后的编码问题!!

[复制链接]
发表于 2018-5-17 10:55:56 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
代码如下:
  1. import requests

  2. a = "https://www.baidu.com"
  3. b = "https://www.zhihu.com"

  4. x = "https://www.apple.com"
  5. y = "https://www.taobao.com"
  6. z = "https://www.github.com"

  7. list1 = [a,b,x,y,z]
  8. for each in list1:
  9.     r=requests.get(each)
  10.     print(r.encoding)
复制代码


输出如下:
ISO-8859-1
ISO-8859-1
UTF-8
utf-8
utf-8


问题:
r.encoding  是什么意思?? r不是字符串啊,是response的对象啊,对象也能编码??
另外,这几个网站的结果都不一样,还会有“ISO-8859-1”的输出,这格式跟我查看他们网页源代码的格式不一样啊?!!!

困惑,遂请教鱼C各路大神!!
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-5-17 11:11:22 | 显示全部楼层
参考这里吧
https://blog.csdn.net/shanzhizi/article/details/50903748
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-5-17 13:00:42 | 显示全部楼层
ba21 发表于 2018-5-17 11:11
参考这里吧
https://blog.csdn.net/shanzhizi/article/details/50903748

您好,这个网页上的资料我看了一下,上面也说了“当你发送请求时,requests会根据HTTP头部来猜测网页编码,当你使用r.text时,requests就会使用这个编码。当然你还可以修改requests的编码形式。”  但是我用 r.text 的时候,中文还是乱码,必须要自己手动改变 r.encoding 才行,这很不智能啊,不科学~~~~~~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-5-17 13:02:26 | 显示全部楼层
ba21 发表于 2018-5-17 11:11
参考这里吧
https://blog.csdn.net/shanzhizi/article/details/50903748

不知道是不是我对r.encoding理解的不对~~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-5-17 13:04:06 | 显示全部楼层
kerwin_lui 发表于 2018-5-17 13:00
您好,这个网页上的资料我看了一下,上面也说了“当你发送请求时,requests会根据HTTP头部来猜测网页编码 ...

看完了?
再说了,人家加密反爬的,又怎么可能 r.text就搞定了。要不编程也没意义了。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-5-17 15:03:07 | 显示全部楼层
ba21 发表于 2018-5-17 13:04
看完了?
再说了,人家加密反爬的,又怎么可能 r.text就搞定了。要不编程也没意义了。

恩恩,感谢了。
我发现用 r.encoding = r.apparent.encoding 后 r.text 就可以正常了,感觉r.apparent.encoding 更准确一些~~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-12-30 05:58

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表