鱼C论坛

 找回密码
 立即注册
查看: 2601|回复: 11

保存网页,出现编码问题,求助!!!!

[复制链接]
发表于 2015-5-13 22:05:48 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request
html = 'http://blog.sina.com.cn/s/blog_4701280b0102egl0.html'
ct = urllib.request.urlopen(html).read().decode('utf-8')
with open('1.html','w') as f:
    f.write(ct)

保存的网址打开后出现乱码现象,有大神能保住解决下吗


搜狗截图20150513220613.png
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2015-5-14 08:36:36 | 显示全部楼层
ct = urllib.request.urlopen(html).read()  #去掉后面的 decode('utf-8')  试试
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-5-14 08:58:03 | 显示全部楼层
小人 发表于 2015-5-14 08:36
ct = urllib.request.urlopen(html).read()  #去掉后面的 decode('utf-8')  试试

这个试过了,去掉的话不行的,而且会报错的
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-5-14 12:14:19 | 显示全部楼层
http://www.python-requests.org/en/latest/
怎么见你们都用urllib,不用requests呢,感觉容易很多
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-5-14 12:25:15 | 显示全部楼层
Seandor 发表于 2015-5-14 12:14
http://www.python-requests.org/en/latest/
怎么见你们都用urllib,不用requests呢,感觉容易很多

你这个是python 2 中的用法吧
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-5-14 20:13:07 | 显示全部楼层
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-5-15 09:19:08 | 显示全部楼层
编码的问题,右键看看人家的编码是什么,自己也这样设置。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-5-15 10:36:53 | 显示全部楼层
徐颖科 发表于 2015-5-15 09:19
编码的问题,右键看看人家的编码是什么,自己也这样设置。

原网页查看后是‘utf-8’的,保存的网页默认打开乱码,在Chrome中改为GBK后就不乱码了,请问知道解决办法吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-5-15 11:21:42 | 显示全部楼层
打开页面给人家解了utf-8的码,保存的时候又不给人家编utf-8的码,到了浏览器里又给人家做utf-8的解码,人家当然给你马赛克!!!
  1. with open('1.html','wb') as f:
  2.     f.write(ct.encode('utf-8'))
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2015-5-15 11:42:04 | 显示全部楼层
dx4789 发表于 2015-5-15 10:36
原网页查看后是‘utf-8’的,保存的网页默认打开乱码,在Chrome中改为GBK后就不乱码了,请问知道解决办法 ...

你不是在Chrome打开没事吗?那还纠结什么?   
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-5-15 13:27:57 | 显示全部楼层
wei_Y 发表于 2015-5-15 11:21
打开页面给人家解了utf-8的码,保存的时候又不给人家编utf-8的码,到了浏览器里又给人家做utf-8的解码,人 ...

正解,十分感谢!!!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-5-22 11:30:09 | 显示全部楼层
dx4789 发表于 2015-5-15 10:36
原网页查看后是‘utf-8’的,保存的网页默认打开乱码,在Chrome中改为GBK后就不乱码了,请问知道解决办法 ...

那你就改编码呀,我们都看不到你网页具体怎么了,怎么给你搞
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-16 02:11

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表