鱼C论坛

 找回密码
 立即注册
查看: 2078|回复: 12

[已解决]python 爬虫报错

[复制链接]
发表于 2022-7-17 14:12:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import urllib.request
import urllib.parse
url ='https://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
data = {}
data['i']= 'I love FishC!'
data['from'] = 'AUTO'
data['to']= 'AUTO'
data['smartresult'] = 'dict'
data['client'] = 'fanyideskweb'
data['salt'] = '16580356408559'
data['sign'] = '3a1d2d9094836b8f3b374ec88a44f9b8'
data['lts'] = '1658035640855'
data['datebv'] = 'ac3645a1fcb1cddff832d1042e2f9dfd'
data['doctype'] = 'json'
data['version'] = '2.1'
data['keyfrom']= 'fanyi.web'
data['action'] = 'FY_BY_REALTlME'

data = urllib.parse.urlencode(data).encode('utf-8')
pp = urllib.request.urlopen(url.data)
html = response.read().decode('utf-8')
报错
    pp = urllib.request.urlopen(url.data)
AttributeError: 'str' object has no attribute 'data'
最佳答案
2022-7-17 14:16:19
提示狠明显了
你的url是一个字符串,哪来的data属性
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-7-17 14:16:19 From FishC Mobile | 显示全部楼层    本楼为最佳答案   
提示狠明显了
你的url是一个字符串,哪来的data属性
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-7-17 14:19:22 | 显示全部楼层
wp231957 发表于 2022-7-17 14:16
提示狠明显了
你的url是一个字符串,哪来的data属性

字打错了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-7-17 14:20:48 | 显示全部楼层
wp231957 发表于 2022-7-17 14:16
提示狠明显了
你的url是一个字符串,哪来的data属性

那改完还有一个报错
    html = response.read().decode('utf-8')
NameError: name 'response' is not defined
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-7-17 14:23:14 From FishC Mobile | 显示全部楼层
shiyouroc 发表于 2022-7-17 14:20
那改完还有一个报错

NameError: name 'response' is not defined
你不看错误信息吗
这不就是response没有定义,就直接使用
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-7-17 14:29:39 | 显示全部楼层
wp231957 发表于 2022-7-17 14:23
NameError: name 'response' is not defined
你不看错误信息吗
这不就是response没有定义,就直接使用

所以,怎么整呢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-7-17 14:32:14 From FishC Mobile | 显示全部楼层
shiyouroc 发表于 2022-7-17 14:29
所以,怎么整呢

import urllib.request
我没在电脑前,不过现在一般都用requests模块
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-7-17 14:33:28 From FishC Mobile | 显示全部楼层
shiyouroc 发表于 2022-7-17 14:29
所以,怎么整呢

https://fishc.com.cn/forum.php?mod=viewthread&tid=200493
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-7-17 14:33:38 | 显示全部楼层
wp231957 发表于 2022-7-17 14:32
import urllib.request
我没在电脑前,不过现在一般都用requests模块

我不是已经import、过来吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-7-17 14:35:18 From FishC Mobile | 显示全部楼层
shiyouroc 发表于 2022-7-17 14:33
我不是已经import、过来吗

你这个是urllib模块,这个模块现在明显使用率不行
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-7-17 14:36:31 | 显示全部楼层
wp231957 发表于 2022-7-17 14:35
你这个是urllib模块,这个模块现在明显使用率不行

我import urllib.requests
他说没有这个模块
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-7-17 14:37:32 From FishC Mobile | 显示全部楼层
shiyouroc 发表于 2022-7-17 14:36
我import urllib.requests
他说没有这个模块

pip  install  requests
import  requests
它是一个三方模块,需要安装
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-7-17 14:50:29 | 显示全部楼层
shiyouroc 发表于 2022-7-17 14:36
我import urllib.requests
他说没有这个模块


有道有反爬机制,像salt,sign,lts都是有加密机制的,不能乱填,你需要去还原有道的加密机制
你还有加上请求头
urllib版的参考代码
import urllib.request
import urllib.parse
import hashlib
import random
import time
import sys

url = "https://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule"

headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.63 Safari/537.36',
    'Referer': 'https://fanyi.youdao.com/',
    'Cookie': 'OUTFOX_SEARCH_USER_ID=1907954952@182.203.147.49; OUTFOX_SEARCH_USER_ID_NCOO=2032702153.1070416; fanyi-ad-id=306808; fanyi-ad-closed=1; ___rl__test__cookies=1654931146702'
}

lts = str(int(time.time()*1000))
salt = lts + str(random.randint(0,10))
sign_str = 'fanyideskweb' + "I love FishC!" + salt + 'Ygy_4c=r#e#4EX^NUGUc5'
m = hashlib.md5(sign_str.encode())
sign = m.hexdigest()

data = {
    "i":"I love FishC!",
    "from":"AUTO",
    "to":"AUTO",
    "smartresult":"dict",
    "client":"fanyideskweb",
    "salt":salt,
    "sign":sign,
    "lts":lts,
    "bv":"a16a6033635b516a9006542112cdda8f",
    "doctype":"json",
    "version":"2.1",
    "keyfrom":"fanyi.web",
    "action":"FY_BY_CLICKBUTTION"
}

data = urllib.parse.urlencode(data).encode('utf-8')
request = urllib.request.Request(url,data,headers)
response = urllib.request.urlopen(request)
html = response.read().decode('utf-8')
try:
    resalut = eval(html)["translateResult"][0][0]["tgt"]
    print("翻译结果:",resalut)
except:
    print("翻译失败")

评分

参与人数 1荣誉 +5 鱼币 +5 贡献 +3 收起 理由
python爱好者. + 5 + 5 + 3 鱼C有你更精彩^_^

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-17 14:34

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表