鱼C论坛

 找回密码
 立即注册
查看: 2480|回复: 5

[已解决]爬豆瓣时候的编码问题,求大神解决

[复制链接]
发表于 2020-11-29 15:22:41 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
检查了网页确实是UTF8,UTF8,UTF-8,utf-8,都试了,都不行。
求大神解决
最佳答案
2020-11-29 15:39:28
解码试试'gbk'
另外open里面encoding打错了。不是enconding
尽量发代码,图片处理起来很麻烦的
微信截图_20201129151933.png
微信截图_20201129151940.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-11-29 15:38:28 | 显示全部楼层
建议复制发一下代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-29 15:39:28 | 显示全部楼层    本楼为最佳答案   
解码试试'gbk'
另外open里面encoding打错了。不是enconding
尽量发代码,图片处理起来很麻烦的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-11-29 15:52:43 | 显示全部楼层
你爬的到底是哪里?你问的是豆瓣,截图上的url却是微博的话题页url,豆瓣top250没有编码问题啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-29 15:57:06 | 显示全部楼层
YunGuo 发表于 2020-11-29 15:52
你爬的到底是哪里?你问的是豆瓣,截图上的url却是微博的话题页url,豆瓣top250没有编码问题啊

题目写错了,不过不影响问题。我看了微博也是utf8的编码,原因是没加Cookie,然后自动给返回的不是要看的页面,是个被拦截的界面,我后面加了个Cookie就好。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-11-29 15:58:53 | 显示全部楼层
逃兵 发表于 2020-11-29 15:39
解码试试'gbk'
另外open里面encoding打错了。不是enconding
尽量发代码,图片处理起来很麻烦的

谢谢大神纠正错误,我发现了,headers内容太少,被反爬了,我加了个Cookie就好了,被反爬以后返回的界面是gbk解码的,刚好我用gbk解码后发现了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-17 06:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表