鱼C论坛

 找回密码
 立即注册
查看: 1149|回复: 9

关于python的爬虫

[复制链接]
发表于 2018-3-10 14:28:26 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
请问一下urlopen在获得网站信息的时候,type,i,xhmlversion,doctpye这些东西都是什么?有什么作用?
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2018-3-11 14:54:22 | 显示全部楼层
{:10_269:有人吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-3-11 15:13:01 From FishC Mobile | 显示全部楼层
能给一下具体代码吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-3-12 18:16:24 | 显示全部楼层
代码呢???
把代码贴出来
贴出来后“@”一下我
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-3-12 18:50:10 | 显示全部楼层
  1. data={}
  2.             data["i"] = content
  3.             data['from'] = 'AUTO'
  4.             data['to'] = 'AUTO'
  5.             data['smartresult'] = 'dict'
  6.             data['client'] = 'fanyideskweb'
  7.             data['doctype'] = 'json'
  8.             data['version'] = '2.1'
  9.             data['keyfrom'] = 'fanyi.web'
  10.             data['action'] = 'FY_BY_CL1CKBUTTON'
  11.             data['typoResult'] = 'true'
  12.             data=urllib.parse.urlencode(data).encode("utf-8")
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-3-12 19:06:28 | 显示全部楼层
  1. data={}     #↓你可以当它是一个data(数据)
  2.             data["i"] = content#←内容
  3.                  #↑名称
  4.             data['from'] = 'AUTO'
  5.             data['to'] = 'AUTO'
  6.             data['smartresult'] = 'dict'
  7.             data['client'] = 'fanyideskweb'
  8.             data['doctype'] = 'json'
  9.             data['version'] = '2.1'
  10.             data['keyfrom'] = 'fanyi.web'
  11.             data['action'] = 'FY_BY_CL1CKBUTTON'
  12.             data['typoResult'] = 'true'
  13.             data=urllib.parse.urlencode(data).encode("utf-8")
  14.             #↑↑↑data(数据以utf-8形式编码)
复制代码

看代码中的注释
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-3-12 20:09:45 | 显示全部楼层

请问一下其中的比如action等标识符代表什么
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-3-12 23:12:26 | 显示全部楼层
  1. data={}     #↓你可以当它是一个data(数据)
  2.             data["i"] = content#←内容
  3.                  #↑名称
  4.             data['from'] = 'AUTO'
  5.             data['to'] = 'AUTO'
  6.             data['smartresult'] = 'dict'
  7.             data['client'] = 'fanyideskweb'
  8.             data['doctype'] = 'json'
  9.             data['version'] = '2.1'
  10.             data['keyfrom'] = 'fanyi.web'
  11.             data['action'] = 'FY_BY_CL1CKBUTTON'
  12.             data['typoResult'] = 'true'
  13.             data=urllib.parse.urlencode(data).encode("utf-8")
  14.             #↑↑↑data(数据以utf-8形式编码)
复制代码

看代码中的注释
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-3-13 00:37:27 | 显示全部楼层

你可以把action拿去翻译一下,然后拿FY_BY_CL1CKBUTTON去百度一下,你就知道答案了,如果你是想照着视频去把这个爬虫做出来是没用的,因为网站规则改了。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2018-3-13 12:32:13 | 显示全部楼层
wongyusing 发表于 2018-3-13 00:37
你可以把action拿去翻译一下,然后拿FY_BY_CL1CKBUTTON去百度一下,你就知道答案了,如果你是想照着视频 ...

请问那我应该按照什么做爬虫?现在找到的基本上不都是这样吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-12-28 12:48

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表