鱼C论坛

 找回密码
 立即注册
查看: 1385|回复: 5

[已解决]有道爬虫添加User-Agent后不能翻译

[复制链接]
发表于 2020-8-19 23:35:50 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我刚开始跟着小甲鱼做,没有添加User-Agent的时候可以翻译,添加了User-Agent之后,一直提示  “ 您的请求来源非法,商业用途使用请关注有道翻译API官方网站“有道智云”: http:\/\/ai.youdao.com
最佳答案
2020-8-19 23:48:18
本帖最后由 Twilight6 于 2020-8-19 23:49 编辑



不懂你的代码是什么样的,按正常来说如果没加 UA 那更不可能翻译成功吧

参考下这个代码吧:
import urllib.request
import urllib.parse
import json
import time
while True:
    content=input('请输入要翻译的内容(如果结束请输入Esc):')
    if content=='Esc':
        break
    headers={}
    headers['User-Agent']='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3706.400 SLBrowser/10.0.4040.400'
    url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
    data={'i':content,
        'from':'AUTO',
        'to':'AUTO',
        'smartresult':'dict',
        'client':'fanyideskweb',
        'salt':'15966771704905',
        'sign': '8634c91db8413ef4cfbe684fd030d518',
        'ts': '1596677170490',
        'bv': 'd16528ec6ead722121051f646932f6ab',
        'doctype': 'json',
        'version': '2.1',
        'keyfrom': 'fanyi.web',
        'action':'FY_BY_REALTlME'}
    data=urllib.parse.urlencode(data).encode('utf-8')
    req = urllib.request.Request(url,data=data,headers=headers)
    response=urllib.request.urlopen(req)
    html=response.read().decode('utf-8')
    target=json.loads(html)
    target=target['translateResult'][0][0]['tgt']
    print(content+' 翻译为:'+target)
    time.sleep(1)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-8-19 23:48:18 | 显示全部楼层    本楼为最佳答案   
本帖最后由 Twilight6 于 2020-8-19 23:49 编辑



不懂你的代码是什么样的,按正常来说如果没加 UA 那更不可能翻译成功吧

参考下这个代码吧:
import urllib.request
import urllib.parse
import json
import time
while True:
    content=input('请输入要翻译的内容(如果结束请输入Esc):')
    if content=='Esc':
        break
    headers={}
    headers['User-Agent']='Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3706.400 SLBrowser/10.0.4040.400'
    url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'
    data={'i':content,
        'from':'AUTO',
        'to':'AUTO',
        'smartresult':'dict',
        'client':'fanyideskweb',
        'salt':'15966771704905',
        'sign': '8634c91db8413ef4cfbe684fd030d518',
        'ts': '1596677170490',
        'bv': 'd16528ec6ead722121051f646932f6ab',
        'doctype': 'json',
        'version': '2.1',
        'keyfrom': 'fanyi.web',
        'action':'FY_BY_REALTlME'}
    data=urllib.parse.urlencode(data).encode('utf-8')
    req = urllib.request.Request(url,data=data,headers=headers)
    response=urllib.request.urlopen(req)
    html=response.read().decode('utf-8')
    target=json.loads(html)
    target=target['translateResult'][0][0]['tgt']
    print(content+' 翻译为:'+target)
    time.sleep(1)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-8-19 23:55:14 | 显示全部楼层
Twilight6 发表于 2020-8-19 23:48
不懂你的代码是什么样的,按正常来说如果没加 UA 那更不可能翻译成功吧

参考下这个代码吧:

我是照着小甲鱼之前的代码敲的,已经可以翻译成功了,但是添加User-Agent之后就一直提示商业用途
req = urllib.request.Request(url,data=data,headers=headers)
我的是req = urllib.request.Request(url,data,head),上面已经定义好参数了
req=urllib.request.Request(url,data)
    req.add_header('User-Agent','Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.116 Safari/537.36' )   
    response = urllib.request.urlopen(req)

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-19 23:55:47 | 显示全部楼层
Hyg123456 发表于 2020-8-19 23:55
我是照着小甲鱼之前的代码敲的,已经可以翻译成功了,但是添加User-Agent之后就一直提示商业用途
req =  ...

发完整代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-8-20 13:51:27 From FishC Mobile | 显示全部楼层
Twilight6 发表于 2020-8-19 23:55
发完整代码

能翻译了,昨晚不行,今天可以了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-8-20 13:59:12 | 显示全部楼层
Hyg123456 发表于 2020-8-20 13:51
能翻译了,昨晚不行,今天可以了

问题解决了的话,就设置下最佳答案吧~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-19 07:53

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表