鱼C论坛

 找回密码
 立即注册
查看: 2369|回复: 3

python爬取有道翻译出错 {‘errorcode’:50}

[复制链接]
发表于 2017-12-28 20:23:23 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 leave591 于 2017-12-28 20:28 编辑

在用urllib对有道翻译进行爬取时,出现了错误。
import urllib.request
import urllib.parse
import time
import random
import hashlib
url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule&sessionFrom=https://www.google.com/'
data = {}
d="aNPG!!u6sesA>hBAW1@(-"
a='fanyideskweb'
f = str(int(time.time()*1000) + random.randint(1,10))
sign = hashlib.md5((a+'hello'+f+d).encode('utf-8')).hexdigest()
data['i'] = 'hello'
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = a
data['salt'] = f
data['sign'] = sign
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_CLICKBUTTION'
data['typoResult'] = 'false'
data = urllib.parse.urlencode(data).encode('utf-8')

req=urllib.request.Request(url,data)
req.add_header('User-Agent','Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36')
print(urllib.request.urlopen(req).read().decode('utf-8'))

QQ截图20171228202120.png

QQ截图20171228202303.png
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-12-28 21:07:46 | 显示全部楼层
'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule&sessionFrom=https://www.google.com/' 把这里面的_o去掉。
爬取有道词典不需要这么多模块吧。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-12-28 23:18:06 From FishC Mobile | 显示全部楼层
这个去掉-0是可以,但是翻译效果不一致
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-12-29 10:58:54 | 显示全部楼层
有大神来解释下嘛?去掉‘_o’确实可以,但是不去掉怎么弄
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-12-26 19:47

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表