[已解决]Python3 爬虫时遇到的中文乱码求助

zyt920514 · 发表于 2017-11-7 12:26:54

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

爬虫百度百科的时候遇到的问题，抓取下来的内容都是乱码，

这是要爬的网页：

https://baike.baidu.com/item/%E6%BC%A9%E6%B6%A1%E9%B8%A3%E4%BA%BA/322717?fr=aladdin&fromid=448077&fromtitle=%E9%B8%A3%E4%BA%BA

这是我的源代码

求大神帮忙看看

最佳答案

月排行榜 / 总排行榜

Teagle

2017-11-7 12:29:23

在wbdata=requests.get(url,headers=headers)后面加上下面这一句话话

wbdata.encoding='utf-8'

复制代码

跳转到最佳答案楼层

Teagle · 发表于 2017-11-7 12:29:23

这个最佳答案由 Teagle 给出，感谢 Teagle 的回答。

单击隐藏图章

在wbdata=requests.get(url,headers=headers)后面加上下面这一句话话

wbdata.encoding='utf-8'

复制代码

zyt920514 · 发表于 2017-11-7 12:52:55

Teagle 发表于 2017-11-7 12:29
在wbdata=requests.get(url,headers=headers)后面加上下面这一句话话

感谢已经好了谢谢你

wongyusing · 发表于 2017-11-7 12:57:15

from urllib import request
url = 'https://baike.baidu.com/item/%E6%BC%A9%E6%B6%A1%E9%B8%A3%E4%BA%BA?fromtitle=%E9%B8%A3%E4%BA%BA&fromid=448077'
html = request.urlopen(url).read().decode('utf-8')
print(html)

复制代码

我爬的不会有问题啊

Teagle · 发表于 2017-11-7 12:57:46

zyt920514 发表于 2017-11-7 12:52
感谢已经好了谢谢你

大哥，设置最佳答案喽

不然这个帖子会一直在未解答那一栏的

账号		自动登录	找回密码
密码			立即注册

[已解决]Python3 爬虫时遇到的中文乱码 求助

马上注册，结交更多好友，享用更多功能^_^

[已解决]Python3 爬虫时遇到的中文乱码求助