鱼C论坛

 找回密码
 立即注册
查看: 646|回复: 1

[已解决]关于引号的使用

[复制链接]
发表于 2019-6-23 09:50:40 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
import re
html = """<meta http-equiv = 'X-UA-Compab' content = 'IE = edge,chorme = 1'>
        <meta http-equiv =  'content-type' content = 'text/html;chaset = utf-8'>
        <meta content = 'always' name = 'referrer'>
        <meta name = 'theme-color' content = '#2932el'>
        <link rel = 'shortcut icon' href = '/favicon.ico' type = 'image/x-icon'/>
        <link rel = 'icon' size = 'any' mask href = '//www.baidu.com/img/baidu.svg'>
        <link rel = 'search' type = 'application/opensearchdescription+xml' href = '/content-search.xml'
        title = '百度搜索'/>'"""

第一种情况:        
pat = re.compile('href = "[0-9a-zA-Z\_\/\-\.]+"')
res = re.findall(pat,html)
res
运行结果:[]

第二种情况:        
pat = re.compile("href = '[0-9a-zA-Z\_\/\-\.]+'")
res = re.findall(pat,html)
res
运行结果:["href = '/favicon.ico'",
"href = '//www.baidu.com/img/baidu.svg'",
"href = '/content-search.xml'"]
我的目的是获取html中href的内容
区别在re.compile中单双引号的使用,顺序不同为什么会出现不同的结果
最佳答案
2019-6-23 16:01:18
因为你要匹配的内容,里面是单引号。引号不同是为了能够转义里面的单引号。

所以正则表达式是严格匹配的,所以里面必须得是单引号。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2019-6-23 16:01:18 | 显示全部楼层    本楼为最佳答案   
因为你要匹配的内容,里面是单引号。引号不同是为了能够转义里面的单引号。

所以正则表达式是严格匹配的,所以里面必须得是单引号。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-19 22:08

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表