爬豆瓣时候的编码问题,求大神解决
检查了网页确实是UTF8,UTF8,UTF-8,utf-8,都试了,都不行。求大神解决 建议复制发一下代码 解码试试'gbk'
另外open里面encoding打错了。不是enconding
尽量发代码,图片处理起来很麻烦的 你爬的到底是哪里?你问的是豆瓣,截图上的url却是微博的话题页url,豆瓣top250没有编码问题啊 YunGuo 发表于 2020-11-29 15:52
你爬的到底是哪里?你问的是豆瓣,截图上的url却是微博的话题页url,豆瓣top250没有编码问题啊
题目写错了,不过不影响问题。我看了微博也是utf8的编码,原因是没加Cookie,然后自动给返回的不是要看的页面,是个被拦截的界面,我后面加了个Cookie就好。 逃兵 发表于 2020-11-29 15:39
解码试试'gbk'
另外open里面encoding打错了。不是enconding
尽量发代码,图片处理起来很麻烦的
谢谢大神纠正错误,我发现了,headers内容太少,被反爬了,我加了个Cookie就好了,被反爬以后返回的界面是gbk解码的,刚好我用gbk解码后发现了
页:
[1]