55课爬虫：隐藏代码运行结果显示UnicodeEncodeError

holistic杀手 · 发表于 2017-9-3 00:25:59

您需要登录才可以下载或查看，没有账号？立即注册

x

代码如下

import urllib.request
import urllib.parse
import json
content = input("请输入需要翻译的内容：")
url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
head ={}
head['User-Agent'] = 'Mozilla/5.0 (Windows NT 10.0; …) Gecko/20100101 Firefox/55.0 '
data ={}
data['i']= content
data['from']='AUTO'
data['to'] = 'AUTO'
data['doctype']='json'
data['version']='2.1'
data['keyfrom']='fanyi.web'
data['action']='FY_BY_CLICKBUTTION'
data['typoResult']='true'
data = urllib.parse.urlencode(data).encode('utf-8')
req = urllib.request.Request(url,data,head)
response = urllib.request.urlopen(req)
html = response.read().decode('utf-8')
target = json.loads(html)
print('翻译结果：%s'%(target['translateResult'][0][0]['tgt']))

复制代码

运行结果如下

什么原因啊，跟着小甲鱼老师敲的，为什么总报错呢？

ba21 · 发表于 2017-9-3 00:31:27

import os,urllib.request
import urllib.parse
import json
a = 5
while a > 0:
txt = input('输入要翻译的内容!')
if txt == '0':
break
else:
os.chdir('e:\\python')
url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom=https://www.baidu.com/link'
data = {
'from':'AUTO',
'to':'AUTO',
'smartresult':'dict',
'client':'fanyideskweb',
'salt':'1500092479607',
'sign':'c98235a85b213d482b8e65f6b1065e26',
'doctype':'json',
'version':'2.1',
'keyfrom':'fanyi.web',
'action':'FY_BY_CL1CKBUTTON',
'typoResult':'true'}
data['i'] = txt
data = urllib.parse.urlencode(data).encode('utf - 8')
wy = urllib.request.urlopen(url,data)
html = wy.read().decode('utf - 8')
print(html)
ta = json.loads(html)
print('翻译结果: %s '% (ta['translateResult'][0][0]['tgt']))
a = a - 1

复制代码

holistic杀手 · 发表于 2017-9-3 00:33:36

ba21 发表于 2017-9-3 00:31

什么原因，可以详细讲一下吗

ba21 · 发表于 2017-9-3 11:24:24

holistic杀手发表于 2017-9-3 00:33
什么原因，可以详细讲一下吗

好比你要到鱼C发表贴子，首先要有帐号密码吧。
这里爬虫已经很明确了，你要爬人家网站的数据不是你想要爬就能爬，对于要求不严的好点，如果要求严的你总得提供合理的访问数据（好比帐号密码）

holistic杀手 · 发表于 2017-9-4 00:18:27

ba21 发表于 2017-9-3 11:24
好比你要到鱼C发表贴子，首先要有帐号密码吧。
这里爬虫已经很明确了，你要爬人家网站的数据不是你想要 ...

可是还是我这个代码，在不加head之前是可以爬的呀。代码如下

复制代码

holistic杀手 · 发表于 2017-9-6 14:12:53

最后问老师终于知道了我的问题其实是useragent的编码问题，改一下浏览器就好了！！

账号		自动登录	找回密码
密码			立即注册

55课爬虫：隐藏 代码运行结果显示UnicodeEncodeError