|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 305910416 于 2016-7-17 10:52 编辑
爬了一个网页的源码
- opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
- response = opener.open(url,urllib.parse.urlencode(data).encode('utf-8'))
- html = response.read().decode('UTF-8')
复制代码
过程中出现了这个报错
UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 11386-11386: Non-BMP character not supported in Tk
肯定是网页里面含有UCS-2 码 在转化的过程中不能转化成unicode 码
请问这个要如何解决
有没有略过的选项
还有都说
isinstance()可以检查编码是否为某个编码
但是我在使用过程中还是有问题
a = isinstance(str,unicode)
还是报错
这个函数检查编码怎么写呢?
本帖最后由 SixPy 于 2016-7-17 11:20 编辑
not supported in Tk
这是 Tk 的问题。
------------
UCS-2 就是 unicode 。
UCS-2 (2-byte Universal Character Set)
|
|