鱼C论坛

 找回密码
 立即注册
查看: 3995|回复: 4

各位老大 我还是不理解parse模块是干什么的

[复制链接]
发表于 2017-4-5 15:01:20 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
各位老大 本人理解力实在是差 还是不懂具体parse起了什么作用,有大神可以给我简要的解释一下吗?小人给大爷跪了
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2017-4-5 15:08:34 | 显示全部楼层
文档解释 他的urlencode(),是将字典转化成为查询字符串,请问这个模块就是这一个简单作用吗?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-4-5 15:53:37 | 显示全部楼层
我的理解,不见得正确,仅供参考
urlopen的作用相当于requests,主要是负责连接的
parse的作用相当于Beautiful soup,主要是负责解析网页成html的
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-4-5 17:18:58 | 显示全部楼层
Python3的urllib.parse常用函数。分享给你供你参考,具体如下:

1、获取url参数

  1. from urllib import parse
  2. url = r'https://docs.python.org/3.5/search.html?q=parse&check_keywords=yes&area=default'
  3. parseResult = parse.urlparse(url)
  4. parseResult
  5. ParseResult(scheme='https', netloc='docs.python.org', path='/3.5/search.html', params='', query='q=parse&check_keywords=yes&area=default', fragment='')
  6. param_dict = parse.parse_qs(parseResult.query)
  7. param_dict
  8. {'q': ['parse'], 'check_keywords': ['yes'], 'area': ['default']}
  9. q = param_dict['q'][0]
  10. q
  11. 'parse'
  12. #注意:加号会被解码,可能有时并不是我们想要的
  13. parse.parse_qs('proxy=183.222.102.178:8080&task=XXXXX|5-3+2')
  14. {'proxy': ['183.222.102.178:8080'], 'task': ['XXXXX|5-3 2']}
复制代码



2、urlencode

  1. from urllib import parse
  2. query = {
  3. 'name': 'walker',
  4. 'age': 99,
  5. }
  6. parse.urlencode(query)
  7. 'name=walker&age=99'
复制代码



3、quote/quote_plus

  1. from urllib import parse
  2. parse.quote('a&b/c')  #未编码斜线
  3. 'a%26b/c'
  4. parse.quote_plus('a&b/c')  #编码了斜线
  5. 'a%26b%2Fc'
复制代码


4、unquote/unquote_plus

  1. from urllib import parse
  2. parse.unquote('1+2')  #不解码加号
  3. '1+2'
  4. parse.unquote('1+2')  #把加号解码为空格
  5. '1 2'
复制代码



如果你还想问为什么没有urldecode——再把示例1看五遍。^_^


对于parse的作用,无非就是解析网站
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-4-5 18:02:34 | 显示全部楼层
我还以为说的是Scrapy里面的parse

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-5-11 23:04

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表