[已解决]网页爬取时UnicodeDecodeError 问题

feng618 · 发表于 2019-1-11 12:55:58

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

UnicodeDecodeError: 'gb2312' codec can't decode byte 0xc6 in position 9538: illegal multibyte sequence
可是我的解码方式就是爬取网站的类型，并且程序在PythonIsta中可以正常运行解码网页，一旦在IDLE或Pycharm中运行就报错，为什么，有解决办法吗？

req.add_header('User-Agent:','Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Mobile Safari/537.36')
proxy = random.choice(proxies)
proxy_support = urllib.request.ProxyHandler({'htpp':proxy})
opener = urllib.request.build_opener(proxy_support)
urllib.request.install_opener(opener)
url = 'https://www.27270.com/ent/rentiyishu/2019/313823.html'
response = urllib.request.urlopen(url)
html = response.read().decode('gb2312')
print(html)

最佳答案

月排行榜 / 总排行榜

塔利班

2019-1-11 17:36:24

decode('gb2312','ignore')

跳转到最佳答案楼层

feng618 · 发表于 2019-1-11 13:05:14

是不是和header有关系？好几次刚开始没问题，运行几次就报错

塔利班 · 发表于 2019-1-11 17:36:24

decode('gb2312','ignore')

账号		自动登录	找回密码
密码			立即注册