鱼C论坛

 找回密码
 立即注册
查看: 1213|回复: 11

[已解决]2个小问题,请大佬指点

[复制链接]
发表于 2019-12-14 13:02:20 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1. 爬有道翻译  明明源码url是‘Request URL: http://fanyi.youdao.com/translat ... mp;smartresult=rule
运行后 报错‘errorCode': 50’
去掉‘translate_o’的‘_o’就OK了,why?
2.print(content['translateResult'][0][0]['tgt']) 中间两个[0] 是啥意思?['translateResult']、['tgt'] 应该是key值吧。(content是{'type': 'ZH_CN2EN', 'errorCode': 0, 'elapsedTime': 1, 'translateResult': [[{'src': '我爱中国', 'tgt': 'I love China'}]]})  莫非是translaResult对应的value有两层[]?为什么有又两层[]呢?
最佳答案
2019-12-14 15:18:44
flyflytoyou 发表于 2019-12-14 13:57
原来如此,感谢大佬指点。。。
大佬知道 为啥 URL  需要去掉 _o 嘛?

因为有 _o 的是有道设计的针对爬虫的陷阱,通过 _o 的连接进入有道的页面的话,需要经过一系列的验证手段,一般的爬虫是无法通过验证的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-12-14 13:16:17 | 显示全部楼层
1. 网址改版,需要去掉 _o。

2. 是 translateResult 对应的值有两层 []。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-14 13:29:44 | 显示全部楼层
[[{'src': '我爱中国', 'tgt': 'I love China'}]]
列表里有个列表(第一个[0]),再里面有个字典(第二个[0]),要取字典的 tgt 的值(末尾的['tgt'])

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-12-14 13:42:20 | 显示全部楼层
zltzlt 发表于 2019-12-14 13:16
1. 网址改版,需要去掉 _o。

2. 是 translateResult 对应的值有两层 []。

网址是 刚才查看源码  url 有_o
那最新的网址 应该怎么查??
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-12-14 13:43:57 | 显示全部楼层
阴阳神万物主 发表于 2019-12-14 13:29
[[{'src': '我爱中国', 'tgt': 'I love China'}]]
列表里有个列表(第一个[0]),再里面有个字典(第二个[0]) ...

那这个数据 在 写代码的时候 就得提前 知道了?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-14 13:55:41 | 显示全部楼层
flyflytoyou 发表于 2019-12-14 13:43
那这个数据 在 写代码的时候 就得提前 知道了?

不用知道数据,但要知道数据格式,这个过程被称作抓包
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-12-14 13:57:45 | 显示全部楼层
阴阳神万物主 发表于 2019-12-14 13:55
不用知道数据,但要知道数据格式,这个过程被称作抓包

原来如此,感谢大佬指点。。。
大佬知道 为啥 URL  需要去掉 _o 嘛?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-14 15:18:44 | 显示全部楼层    本楼为最佳答案   
flyflytoyou 发表于 2019-12-14 13:57
原来如此,感谢大佬指点。。。
大佬知道 为啥 URL  需要去掉 _o 嘛?

因为有 _o 的是有道设计的针对爬虫的陷阱,通过 _o 的连接进入有道的页面的话,需要经过一系列的验证手段,一般的爬虫是无法通过验证的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-12-14 17:26:40 | 显示全部楼层
阴阳神万物主 发表于 2019-12-14 15:18
因为有 _o 的是有道设计的针对爬虫的陷阱,通过 _o 的连接进入有道的页面的话,需要经过一系列的验证手段 ...

大佬 你这话 怎么像 一本正经的胡说八道哇。。。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-14 20:19:36 | 显示全部楼层
flyflytoyou 发表于 2019-12-14 17:26
大佬 你这话 怎么像 一本正经的胡说八道哇。。。

你居然猜对了?!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-12-14 20:52:05 | 显示全部楼层

这么欺负萌新 合适嘛,我还是很迷惑
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-12-14 21:37:25 | 显示全部楼层
flyflytoyou 发表于 2019-12-14 20:52
这么欺负萌新 合适嘛,我还是很迷惑

但是那个连接反爬是真的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-19 20:58

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表