长岛冰茶不好喝 发表于 2020-11-29 15:22:41

爬豆瓣时候的编码问题,求大神解决

检查了网页确实是UTF8,UTF8,UTF-8,utf-8,都试了,都不行。
求大神解决

小甲鱼的铁粉 发表于 2020-11-29 15:38:28

建议复制发一下代码

逃兵 发表于 2020-11-29 15:39:28

解码试试'gbk'
另外open里面encoding打错了。不是enconding
尽量发代码,图片处理起来很麻烦的

YunGuo 发表于 2020-11-29 15:52:43

你爬的到底是哪里?你问的是豆瓣,截图上的url却是微博的话题页url,豆瓣top250没有编码问题啊

长岛冰茶不好喝 发表于 2020-11-29 15:57:06

YunGuo 发表于 2020-11-29 15:52
你爬的到底是哪里?你问的是豆瓣,截图上的url却是微博的话题页url,豆瓣top250没有编码问题啊

题目写错了,不过不影响问题。我看了微博也是utf8的编码,原因是没加Cookie,然后自动给返回的不是要看的页面,是个被拦截的界面,我后面加了个Cookie就好。

长岛冰茶不好喝 发表于 2020-11-29 15:58:53

逃兵 发表于 2020-11-29 15:39
解码试试'gbk'
另外open里面encoding打错了。不是enconding
尽量发代码,图片处理起来很麻烦的

谢谢大神纠正错误,我发现了,headers内容太少,被反爬了,我加了个Cookie就好了,被反爬以后返回的界面是gbk解码的,刚好我用gbk解码后发现了
页: [1]
查看完整版本: 爬豆瓣时候的编码问题,求大神解决