鱼C论坛

 找回密码
 立即注册
查看: 1858|回复: 4

[已解决]Python3 爬虫时遇到的中文乱码 求助

[复制链接]
发表于 2017-11-7 12:26:54 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
爬虫百度百科的时候遇到的问题,抓取下来的内容都是乱码,

这是要爬的网页:

https://baike.baidu.com/item/%E6%BC%A9%E6%B6%A1%E9%B8%A3%E4%BA%BA/322717?fr=aladdin&fromid=448077&fromtitle=%E9%B8%A3%E4%BA%BA

dddddd8.png

这是我的源代码

1111f.png


Q333333.png


求大神帮忙看看



最佳答案
2017-11-7 12:29:23
在wbdata=requests.get(url,headers=headers)后面加上下面这一句话话
  1. wbdata.encoding='utf-8'
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-11-7 12:29:23 | 显示全部楼层    本楼为最佳答案   
在wbdata=requests.get(url,headers=headers)后面加上下面这一句话话
  1. wbdata.encoding='utf-8'
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2017-11-7 12:52:55 | 显示全部楼层
Teagle 发表于 2017-11-7 12:29
在wbdata=requests.get(url,headers=headers)后面加上下面这一句话话

感谢 已经好了 谢谢你
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-11-7 12:57:15 | 显示全部楼层
  1. from urllib import request
  2. url = 'https://baike.baidu.com/item/%E6%BC%A9%E6%B6%A1%E9%B8%A3%E4%BA%BA?fromtitle=%E9%B8%A3%E4%BA%BA&fromid=448077'
  3. html = request.urlopen(url).read().decode('utf-8')
  4. print(html)
复制代码

我爬的不会有问题啊
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-11-7 12:57:46 | 显示全部楼层
zyt920514 发表于 2017-11-7 12:52
感谢 已经好了 谢谢你

大哥,设置最佳答案喽

不然这个帖子会一直在未解答那一栏的

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-3 19:18

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表