[已解决]【求助】Python2.7里转码后依旧无法处理输入的中文和特殊字符

zyhao · 发表于 2016-11-2 19:28:48

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

各位大神好，我是一个最近在自学python的新手，写了个抓取翻译网站结果的程序，因为涉及到中文和特殊字符于是遇到了编码的问题，看了好多资料还是搞不明白。。。代码，运行结果和问题如下：

# -*- coding:utf-8 -*-
import lxml
import urllib2
import urllib
from lxml import etree
while True:
content = raw_input(u'你想翻译啥:')
if content == 'quit':
break
print content
print type(content)
url = 'http://www.godic.net/'
data = {}
data['inputword']= content.encode('utf-8')
data['recordid']=''
data['forcecg']='false'
data['cgformidx']='0'
datas = urllib.urlencode(data).encode('utf-8')
response = urllib2.urlopen(url,data=datas)
html = response.read().decode('utf-8')
a = etree.HTML(html)
shuchu = a.xpath('//*[@id="ExpFCChild"]/text()|//*[@id="ExpFCChild"]/*[@class="exp"]/text()|//*[@id="ExpFCChild"]/*[@class="cara"]/text()')
b = ''
for each in shuchu:
b = b+each+'\n'
print b

复制代码

当输入正常英文字母组成的单词时比如‘Tag’可以正常返回结果，输入中文比如‘天’也可以正常运行，但是因为这是个德语翻译网站，输入包含德语特殊字符的单词时比如‘schön’就报错了，如下：

>>>
RESTART: C:\Users\Administrator.wm-201606302307\Desktop\python2.7\shiyan.py
你想翻译啥:tag
tag
<type 'str'>
m. (-[e]s,-e)
1.天，日子
2.白天
3.Tag für Tag 日复一日
4.von Tag zu
Tag 一天天，逐渐
5.Guten Tag 你好（白天用）
Tag
m.-(e)s,-e白天；gutenTag!（白天）好！
你想翻译啥:天
天
<type 'unicode'>
1. Himmel m.; 2. oben; 3. Tag; 4. Jahreszeit f.; 5. Wetter n.
你想翻译啥:schön
schön
<type 'str'>
Traceback (most recent call last):
File "C:\Users\Administrator.wm-201606302307\Desktop\python2.7\shiyan.py", line 19, in <module>
data['inputword']= content.encode('utf-8')
UnicodeDecodeError: 'ascii' codec can't decode byte 0xf6 in position 3: ordinal not in range(128)
>>>

复制代码

我觉得问题主要在 data['inputword']= content.encode('utf-8') 这一句，最后加上.encode('utf-8')时，输入中文不会报错，特殊字符会报错，去掉.encode('utf-8')时输入特殊字符倒是不会报错了，但是输入中文会报错，而且不报错返回的结果也都是空白

真的是快疯了，请各位大神指导一下如何正常处理各种字符~~

最佳答案

月排行榜 / 总排行榜

SixPy

2016-11-3 08:29:07

用 python3吧

跳转到最佳答案楼层

SixPy · 发表于 2016-11-3 08:29:07

用 python3吧

zyhao · 发表于 2016-11-3 20:35:13

SixPy 发表于 2016-11-3 08:29
用 python3吧

其实我开始自学的就是python3，自己写的代码运行也完全没问题，因为想把这段代码放在新浪云上，而新浪云只支持2.7版本的

。。。害的我又开始折腾2.7的编码问题

账号		自动登录	找回密码
密码			立即注册