UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbb in position 918: inv...

sunshine似我 · 发表于 2017-5-3 16:54:15

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

爬取网页图片时一直报UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbb in position 918: invalid start byte错误，用的是Python3，求指教
网上说的方法：
1.
#!/usr/bin/env Python
# coding=utf-8
2.
#encoding=utf8
import sys
reload(sys)
sys.setdefaultencoding('gbk')
都不对。

gopythoner · 发表于 2017-5-3 17:48:02

使用try...except语句，把不能转码成功的字符串忽略掉，有些特殊字符是转换不了的，比如一些手机形成的表情

sunshine似我 · 发表于 2017-5-3 18:11:22

gopythoner 发表于 2017-5-3 17:48
使用try...except语句，把不能转码成功的字符串忽略掉，有些特殊字符是转换不了的，比如一些手机形成的表情

感觉和你说的不是一个情况，是在网页上下载照片

18813034116 · 发表于 2017-5-3 18:32:18

错误可能是有一些非ASCII字符，不能进行编码/解码。避免此错误的一个简单方法是使用encode()函数对这些字符串进行encode() ，如下所示（如果a是具有非ASCII字符的字符串）：
a.encode('utf-8').strip()

sunshine似我 · 发表于 2017-5-4 15:51:46

html = response.read( ).decode('gbk')就可以了

账号		自动登录	找回密码
密码			立即注册