鱼C论坛

 找回密码
 立即注册
查看: 1171|回复: 16

[已解决]爬虫的一个小问题

[复制链接]
发表于 2018-9-19 20:07:31 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我想把百度翻译的翻译答案搞出来,不过有点问题就是,按照视频的方法输代码,最后给了我一个
{"error":997,"from":"en","to":"zh","query":"query"}
这样的字典,求问如何破!代码如下
  1. import urllib.request
  2. import urllib.parse

  3. url = 'https://fanyi.baidu.com/v2transapi'
  4. data = {'from': 'en' ,\
  5.         'to': 'zh' ,\
  6.         'query': 'query' ,\
  7.         'transtype': 'realtime' ,\
  8.         'simple_means_flag': '3' ,\
  9.         'sign': '851680.531921' ,\
  10.         'token': 'e712095b913cfa27025e54b27b38b2a7'}

  11. data = urllib.parse.urlencode(data).encode('utf-8')
  12. response = urllib.request.urlopen(url,data)
  13. html = response.read().decode('utf-8')


  14. print(html)
复制代码
最佳答案
2018-9-19 21:45:02
RIXO 发表于 2018-9-19 20:27
怎么获取token啊

我看了下,请求需要带cookies ,火狐浏览器重新发送请求头,把第一个cookies删除就无法请求成功,问题就在那个cook上
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2018-9-19 20:10:59 | 显示全部楼层
你直接浏览器点都是这样的,换个翻译地址吧
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-19 20:14:40 | 显示全部楼层
'token': 'e712095b913cfa27025e54b27b38b2a7'   token这个要先获取一下,不是固定的,在原始网站上 ,差不多是验证你身份的东西
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-19 20:16:47 | 显示全部楼层
塔利班 发表于 2018-9-19 20:10
你直接浏览器点都是这样的,换个翻译地址吧

。。。。。。。。你从元素审查找出来的网址肯定是啥也没传啊,返回正常网页才奇怪吧!!!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-19 20:18:43 | 显示全部楼层
塔利班 发表于 2018-9-19 20:10
你直接浏览器点都是这样的,换个翻译地址吧

最烦躁的是,我刚刚用有道的试了一下,结果返回{"errorCode":50}
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-19 20:20:26 | 显示全部楼层
有道那个URL把 _o 去掉就OK了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-19 20:23:06 | 显示全部楼层
塔利班 发表于 2018-9-19 20:20
有道那个URL把 _o 去掉就OK了

有道的为什么要去掉_o啊,原理是啥
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-19 20:24:57 | 显示全部楼层
先人的经验,鱼C祖传的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-19 20:27:03 | 显示全部楼层
waitforlove 发表于 2018-9-19 20:14
'token': 'e712095b913cfa27025e54b27b38b2a7'   token这个要先获取一下,不是固定的,在原始网站上 ,差不多 ...

怎么获取token啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-19 20:28:06 | 显示全部楼层
塔利班 发表于 2018-9-19 20:24
先人的经验,鱼C祖传的

好想打你怎么办
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-19 21:45:02 | 显示全部楼层    本楼为最佳答案   
RIXO 发表于 2018-9-19 20:27
怎么获取token啊

我看了下,请求需要带cookies ,火狐浏览器重新发送请求头,把第一个cookies删除就无法请求成功,问题就在那个cook上
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-19 22:13:24 | 显示全部楼层
waitforlove 发表于 2018-9-19 21:45
我看了下,请求需要带cookies ,火狐浏览器重新发送请求头,把第一个cookies删除就无法请求成功,问题就在那 ...

百度的这个cookies好像加密了,网页中并没要找到数据,token到是能找到
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-19 22:17:19 | 显示全部楼层
waitforlove 发表于 2018-9-19 22:13
百度的这个cookies好像加密了,网页中并没要找到数据,token到是能找到

好吧,谢谢了,待我变厉害之后我再来解决它
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-19 22:34:01 | 显示全部楼层
RIXO 发表于 2018-9-19 22:17
好吧,谢谢了,待我变厉害之后我再来解决它

兄弟我已经帮你解决,原来那个cookies在百度首页,www.baudi.com ,上个厕所来写代码给你
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-9-19 22:51:18 | 显示全部楼层
waitforlove 发表于 2018-9-19 22:34
兄弟我已经帮你解决,原来那个cookies在百度首页,www.baudi.com ,上个厕所来写代码给你

我觉得你讲下找的思路比代码重要!!!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-19 23:08:51 | 显示全部楼层
RIXO 发表于 2018-9-19 22:51
我觉得你讲下找的思路比代码重要!!!

建议使用火狐浏览器,因为可以自己定义请求头发送
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-9-20 07:57:49 | 显示全部楼层
waitforlove 发表于 2018-9-19 23:08
建议使用火狐浏览器,因为可以自己定义请求头发送
  1. import requests
  2. data = {'kw':'I love you'}#这里是要翻译的内容
  3. headers={
  4.         'Host':'fanyi.baidu.com',
  5.         'User-Agent':'Mozilla/5.0 (Windows NT 6.1; rv:61.0) Gecko/20100101 Firefox/61.0',
  6.         'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8',}
  7. shuju = requests.post(url='https://fanyi.baidu.com/sug',data=data,headers=headers).json()
  8. for i in shuju['data']:
  9.         print(i)
复制代码
你的那个请求地址踢麻烦了,那个sign的值我这么都找不出来,请求这个地址超级方便

评分

参与人数 1荣誉 +5 鱼币 +5 贡献 +3 收起 理由
RIXO + 5 + 5 + 3 呃,好吧,是我没找对post的网址

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-23 19:07

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表