鱼C论坛

 找回密码
 立即注册
查看: 1528|回复: 3

为什么gbk编码的网页用gb2312也能解码成功?

[复制链接]
发表于 2019-8-4 13:09:18 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
测试页面:https://fishc.com.cn/ ,页面是gbk编码,为什么我用gb2312也能成功解码(没有报错)? 应该怎样做才能引起异常,或者如何做到判断为gbk,而不是gb2312?


【课后作业第53节】:
链接:https://fishc.com.cn/forum.php?m ... peid%26typeid%3D398

我的代码:
  1. import urllib.request

  2. url = input('请输入URL:')
  3. html = urllib.request.urlopen(url)
  4. response = html.read()

  5. import chardet
  6. guess = chardet.detect(response)['encoding']

  7. try:
  8.     if guess == 'GB2312':
  9.         response.decode('GB2312')
  10. except UnicodeDecodeError:
  11.     print('出错啦')
  12.     guess = 'GBK'

  13. print('该网页使用的编码是:%s'%guess)
复制代码





小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2019-8-4 19:50:08 | 显示全部楼层
已解决
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-8-4 21:53:28 From FishC Mobile | 显示全部楼层
geen 发表于 2019-8-4 19:50
已解决

2312应该向下兼容gbk
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-8-5 09:35:19 | 显示全部楼层
wp231957 发表于 2019-8-4 21:53
2312应该向下兼容gbk

GBK字符集是GB2312的扩展,加入对繁体字的支持,兼容GB2312。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-17 10:01

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表