鱼C论坛

 找回密码
 立即注册
查看: 1028|回复: 1

爬虫不懂就问系列

[复制链接]
发表于 2019-8-12 19:53:31 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
今天刚看了小甲鱼关于爬虫的视频,关于有道翻译,目前的有道翻译的url是:http://fanyi.youdao.com/translat ... mp;smartresult=rule,如果用这个的话是会出现error:50,但是去掉_o为什么就成功爬出来了?求大神指点迷津
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-8-13 10:26:24 | 显示全部楼层
因为你直接点击http://fanyi.youdao.com/translat ... mp;smartresult=rule这个链接实际上是一个get方法,自然不能得到正确的结果。你如果想抓取到正确的结果需要使用post方法传递正确的参数。

另外去掉_o你说抓取出来了,实际上并不是。去掉后你获取到的是有道翻译主页的源码,因为url进行了重定向,实际上请求的是fanyi.youdao.com。

抓取有道翻译的首页的源码没有什么意义,分析有道翻译的页面主要是为了获取它用来进行翻译的API,也就是http://fanyi.youdao.com/translat ... mp;smartresult=rule

有可能有加密吧,反正之前我分析百度翻译的时候需要进行js解密才能得到正确的翻译结果。

如果你学python不太久,不建议一开始就搞很难的东西,会打消积极性

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-1-17 15:47

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表