求注释
import urllib.requestimport urllib.parse
import json
import time
while 1:
content=input('请输入待翻译的内容(输入"q"退出程序);')
if content == 'q':
break
url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom=https://www.baidu.com/link'
head={}
head['user-agent']='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'
data={}
data['i']=content
data['from']='AUTO'
data['to']='AUTO'
data['smartresult']='dict'
data['client']='fanyideskweb'
data['salt']='16107800339874'
data['sign']='ebef049057a19a02ec85ed67bfc445f3'
data['lts']='1610780033987'
data['bv']='e65e8e5642f3c2d719d32db0b5eff1f9'
data['doctype']='json'
data['version']='2.1'
data['keyfrom']='fanyi.web'
data['action']='FY_BY_CLICKBUTTION'
data=urllib.parse.urlencode(data).encode('utf-8')#
req=urllib.request.Request(url,data,head)#
respone=urllib.request.urlopen(url,data)#
html=respone.read().decode('utf-8')#
target=json.loads(html)
target=target['translateResult']['tgt']#
print(target)
time.sleep(2)
如上,#的不是很明白, import urllib.request
import urllib.parse
import json
import time
while 1:
content=input('请输入待翻译的内容(输入"q"退出程序);')
if content == 'q':
break
url='http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule&sessionFrom=https://www.baidu.com/link'
head={}
head['user-agent']='Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36'
data={}
data['i']=content
data['from']='AUTO'
data['to']='AUTO'
data['smartresult']='dict'
data['client']='fanyideskweb'
data['salt']='16107800339874'
data['sign']='ebef049057a19a02ec85ed67bfc445f3'
data['lts']='1610780033987'
data['bv']='e65e8e5642f3c2d719d32db0b5eff1f9'
data['doctype']='json'
data['version']='2.1'
data['keyfrom']='fanyi.web'
data['action']='FY_BY_CLICKBUTTION'
data=urllib.parse.urlencode(data).encode('utf-8')# 编码传输的数据
req=urllib.request.Request(url,data,head)# 这个有错误,应该是urllib.request.Request(url, data=data, headers=head),把url,数据和header封装成请求对象
respone=urllib.request.urlopen(url,data)# 这个也有错误,应该是 urllib.request.urlopen(req), 都封装成请求对象了,就直接用。
html=respone.read().decode('utf-8')# 将访问后得到的数据解码
target=json.loads(html)
target=target['translateResult']['tgt']#数据转成了json数据,jsonload只是变成了python 字典or列表对象,这里就是访问对象的元素
print(target)
time.sleep(2)
找一个靠谱的爬虫书看吧,这个代码错误有点多。 suchocolate 发表于 2021-1-16 17:32
找一个靠谱的爬虫书看吧,这个代码错误有点多。
req=urllib.request.Request(url,data,head)
这句好像没有错,用位置参数可以这么写吧 洋洋痒 发表于 2021-1-16 23:31
req=urllib.request.Request(url,data,head)
这句好像没有错,用位置参数可以这么写吧
是的,不会引起报错。
但码源是这样写的:__init__(self, url, data=None, headers={}, origin_req_host=None, unverifiable=False, method=None)
养成良好的代码习惯,用关键字能免去位置烦恼,还能明确含义,这样更规范。
suchocolate 发表于 2021-1-16 17:32
找一个靠谱的爬虫书看吧,这个代码错误有点多。
就是找不到哦。小甲鱼的看了也发现错误了。
页:
[1]