[已解决]编码问题.

305910416 · 发表于 2016-7-17 10:33:21

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由 305910416 于 2016-7-17 10:52 编辑

爬了一个网页的源码

opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
response = opener.open(url,urllib.parse.urlencode(data).encode('utf-8'))
html = response.read().decode('UTF-8')

复制代码

过程中出现了这个报错

UnicodeEncodeError: 'UCS-2' codec can't encode characters in position 11386-11386: Non-BMP character not supported in Tk

肯定是网页里面含有UCS-2 码在转化的过程中不能转化成unicode 码
请问这个要如何解决
有没有略过的选项

还有都说
isinstance()可以检查编码是否为某个编码
但是我在使用过程中还是有问题
a = isinstance(str,unicode)
还是报错
这个函数检查编码怎么写呢？

最佳答案

月排行榜 / 总排行榜

SixPy

2016-7-17 11:19:21

本帖最后由 SixPy 于 2016-7-17 11:20 编辑

not supported in Tk

这是 Tk 的问题。
------------
UCS-2 就是 unicode 。

UCS-2 (2-byte Universal Character Set)

跳转到最佳答案楼层

SixPy · 发表于 2016-7-17 11:19:21

本帖最后由 SixPy 于 2016-7-17 11:20 编辑

not supported in Tk

这是 Tk 的问题。
------------
UCS-2 就是 unicode 。

UCS-2 (2-byte Universal Character Set)

305910416 · 发表于 2016-7-17 11:33:53

SixPy 发表于 2016-7-17 11:19
not supported in Tk

这是 Tk 的问题。

终于在外文上面找到了解决办法

non_bmp_map = dict.fromkeys(range(0x10000, sys.maxunicode + 1), 0xfffd)
sender_all[i].translate(non_bmp_map)

复制代码

305910416 · 发表于 2016-7-17 11:34:59

SixPy 发表于 2016-7-17 11:19
not supported in Tk

这是 Tk 的问题。

还有个问题，有没有比idle更好显示的编码器呢？

SixPy · 发表于 2016-7-17 11:46:04

直接双击，在小黑窗里运行，看会不会出错？

305910416 · 发表于 2016-7-17 12:28:23

SixPy 发表于 2016-7-17 11:46
直接双击，在小黑窗里运行，看会不会出错？

已经解决了该问题
想问一下有没有其他的编码器类似这种带编译的

huomqh · 发表于 2016-8-15 20:30:37

305910416 发表于 2016-7-17 11:33
终于在外文上面找到了解决办法

能不能具体一点？针对你上面的代码，应该怎么调整？

账号		自动登录	找回密码
密码			立即注册