关于爬虫的问题，如何获取正确Request URL?

si4242 · 发表于 2017-8-20 22:56:20

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

在《0基础入门学习python》的第54章，利用有道词典在python上做翻译，从审查元素的Header --> General --> Request  URL：复制粘贴里面的内容就可以。
但是我按照视频操作之后，提示报错 {"errorCode":50}
然后我把Request  URL 里的链接看了下，也是显示这个
请问如何获取正确的Request  URL？

新人今天竟然没办法上传图片……好尴尬
我先贴代码吧

import urllib.request as ur
import urllib.parse as up

url = 'http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule&sessionFrom='
data = {}
data['i'] = 'i love china'
data['from'] = 'AUTO'
data['to'] = 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '1503238450740'
data['sign'] = 'ac7dbcbe45ab98281de78a5f787c4016'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom'] = 'fanyi.web'
data['action'] = 'FY_BY_CLICKBUTTION'
data['typoResult'] = 'true'
data = up.urlencode(data).encode('utf-8')

respond = ur.urlopen(url,data)
html = respond.read().decode('utf-8')

print(html)

ba21 · 发表于 2017-8-20 23:05:20

header伪造

import urllib.request
import urllib.parse
import time
import random
import hashlib
import json
url='http://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule&sessionFrom=null'
u='fanyideskweb'
d='you'
f=str(int(time.time()*1000))
c="rY0D^0'nM0}g5Mm1z%1G4"
g=hashlib.md5()
g.update((u + d + f + c).encode('utf-8'))
head={}
head['User-Agent']='Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:54.0) Gecko/20100101 Firefox/54.0'
head['Host']='fanyi.youdao.com'
head['Referer']='http://fanyi.youdao.com/'
data={}
data['i']=d
data['from']='AUTO'
data['to']='AUTO'
data['smartresult']='dict'
data['client']=u
data['salt']=f
data['sign']=g.hexdigest()
data['doctype']='json'
data['version']='2.1'
data['keyfrom']='fanyi.web'
data['action']='FY_BY_CL1CKBUTTON'
data['typoResult']='true'
data=urllib.parse.urlencode(data).encode('utf-8')
req=urllib.request.Request(url,data,head)
response=urllib.request.urlopen(req)
html=response.read().decode('utf-8')
target=json.loads(html)
#print(html)
print('翻译结果： %s ' % (target['translateResult'][0][0]['tgt']))

复制代码

账号		自动登录	找回密码
密码			立即注册

关于爬虫的问题，如何获取正确Request URL?

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块