鱼C论坛

 找回密码
 立即注册
查看: 3630|回复: 12

[已解决]网易翻译爬虫

[复制链接]
发表于 2022-4-25 20:29:17 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
为什么我按照小甲鱼说的把data里的数据全都放进字典里去了,但是运行就报{"errorCode":50}。。。求大神看一眼。。

import urllib.request
import urllib.parse
url = 'https://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule'
data = {}

data['i'] = '我是你妈妈'
data['smartresult'] = 'dict'
data ['client'] = 'fanyideskweb'
data ['salt']='16508879090005'
data ['sign']= '67eada1d1767da800db1c0428a8483eb'
data ['lts']= '1650887909000'
data ['bv']= 'ac3968199d18b7367b2479d1f4938ac2'
data ['doctype']= 'json'
data ['version']= '2.1'
data ['keyfrom']= 'fanyi.web'
data ['action']=' FY_BY_REALTlME'
data ['from'] = 'AUTO'
data ['to']= 'AUTO'
data = urllib.parse.urlencode(data).encode('ascii')

response = urllib.request.urlopen(url , data)
html = response.read().decode('ascii')
print(html)
最佳答案
2022-4-25 21:53:01
Victor0321 发表于 2022-4-25 21:51
我其实是想往AI方面走 。。。 不知道爬虫这一块 需要不需要花费太多时间深究

看你有没有耐心了,心急也吃不了热豆腐
捕获.JPG
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-4-25 20:30:30 | 显示全部楼层
import urllib.request
import urllib.parse
url = 'https://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'     # 把 _o 去掉
data = {}

data['i'] = '我是你妈妈'
data['smartresult'] = 'dict'
data ['client'] = 'fanyideskweb'
data ['salt']='16508879090005'
data ['sign']= '67eada1d1767da800db1c0428a8483eb'
data ['lts']= '1650887909000'
data ['bv']= 'ac3968199d18b7367b2479d1f4938ac2'
data ['doctype']= 'json'
data ['version']= '2.1'
data ['keyfrom']= 'fanyi.web'
data ['action']=' FY_BY_REALTlME'
data ['from'] = 'AUTO'
data ['to']= 'AUTO'
data = urllib.parse.urlencode(data).encode('ascii')

response = urllib.request.urlopen(url , data)
html = response.read().decode()                            # 去掉 'ascii'
print(html)
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-4-25 21:03:14 | 显示全部楼层

可是我刚看了下 我检索里的Url 的确是带了那个o的啊。。那个o是啥意思啊

https://fanyi.youdao.com/translate_o?smartresult=dict&smartresult=rule
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-25 21:13:17 | 显示全部楼层
Victor0321 发表于 2022-4-25 21:03
可是我刚看了下 我检索里的Url 的确是带了那个o的啊。。那个o是啥意思啊

https://fanyi.youdao.com/tr ...


o 应该是 online 的意思,那个应该是在线接口,

你不要光看 url ,http 可不只有 url 这一部分,还有请求头,请求体,

你既然要保证那个带 o 的可以,你就得复刻它的请求,请求体有了,还差请求头,

那个在线接口你加一个 cookie 就可以了,

而不带 o 的才是它的离线接口
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-4-25 21:31:39 | 显示全部楼层
isdkz 发表于 2022-4-25 21:13
o 应该是 online 的意思,那个应该是在线接口,

你不要光看 url ,http 可不只有 url 这一部分,还 ...

我发现有的直接复制那个url就可以。。。但有的就不行。。有什么方法能快速的识别哪些才是我真正需要然后输到python里爬虫用的么。。。

https://www.google-analytics.com ... 4k0&z=487883916
捕获.JPG
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-25 21:34:31 | 显示全部楼层
Victor0321 发表于 2022-4-25 21:31
我发现有的直接复制那个url就可以。。。但有的就不行。。有什么方法能快速的识别哪些才是我真正需要然后 ...

没什么办法,纯靠经验,不同的网站反爬不一样,

请求头的反爬主要是 user-agent、referer、cookies 这几个字段,

有一些还会根据 origin
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-4-25 21:45:06 | 显示全部楼层
isdkz 发表于 2022-4-25 21:34
没什么办法,纯靠经验,不同的网站反爬不一样,

请求头的反爬主要是 user-agent、referer、cookies 这 ...

我感觉好难 。。。  

user-agent、referer、cookies  一般就是这些开头的字段都要去掉么?还是。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-25 21:46:25 | 显示全部楼层
本帖最后由 isdkz 于 2022-4-25 21:47 编辑
Victor0321 发表于 2022-4-25 21:45
我感觉好难 。。。  

user-agent、referer、cookies  一般就是这些开头的字段都要去掉么? ...


一般要添加这些头部信息来访问绕过反爬机制,这也不难,跟着一些比较好的教程来去学习就好了,

崔庆才的书不错,你可以去看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-4-25 21:51:41 | 显示全部楼层
isdkz 发表于 2022-4-25 21:46
一般要添加这些头部信息来访问绕过反爬机制,这也不难,跟着一些比较好的教程来去学习就好了,

崔庆 ...

我其实是想往AI方面走 。。。 不知道爬虫这一块 需要不需要花费太多时间深究
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-25 21:53:01 | 显示全部楼层    本楼为最佳答案   
Victor0321 发表于 2022-4-25 21:51
我其实是想往AI方面走 。。。 不知道爬虫这一块 需要不需要花费太多时间深究

看你有没有耐心了,心急也吃不了热豆腐
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-4-25 21:56:34 | 显示全部楼层
isdkz 发表于 2022-4-25 21:53
看你有没有耐心了,心急也吃不了热豆腐

emmmm 慢慢来,但是现在就是在花时间学。。。   刚好一个月差不多。。 整体好像都懂就是没串起来过
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-4-26 00:14:27 | 显示全部楼层
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2022-4-26 00:16:11 | 显示全部楼层

啊?  这是水帖的么
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-28 02:45

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表