鱼C论坛

 找回密码
 立即注册
查看: 2010|回复: 3

[已解决]类似贴中说的两种代码的时间都适用的正则表达式怎么写?

[复制链接]
发表于 2016-11-19 19:54:20 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 crxliy 于 2016-11-19 20:05 编辑

分析一个网站代码时候看到,一个页面中标题有下面两种时间的代码,我想爬取标题和标题中的时间,怎么写正则表达式可以爬取下面两种代码中的时间呢? 要这种格式的时间  2016-xx-xx
<em><span>2016-10-31</span></em>
<em><span class="xi1"><span title="2016-11-19">7&nbsp;小时前</span></span></em>

这个就匹配到含有其他代码进去了
r'<em><span.*?>(.*?)</span>'

下面是我写的但是都只能提取上面第一种
r'<span.*?<span title="(.*?)">.*?</span></span>'
最佳答案
2016-11-19 20:18:15
本帖最后由 SixPy 于 2016-11-19 22:06 编辑

[>"](\d{4}-(?:0?[1-9]|1[0-2])-(?:0?[1-9]|[12]\d|3[01]))["<]
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2016-11-19 20:12:42 | 显示全部楼层
[>"](\d{4}-\d{1,2}-\d{1,2})["<]
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-11-19 20:18:15 | 显示全部楼层    本楼为最佳答案   
本帖最后由 SixPy 于 2016-11-19 22:06 编辑

[>"](\d{4}-(?:0?[1-9]|1[0-2])-(?:0?[1-9]|[12]\d|3[01]))["<]
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-11-19 21:11:37 | 显示全部楼层
SixPy 发表于 2016-11-19 20:18
[>"](\d{4}-(?:[0]?[1-9]|1[0-2])-(?:[0]?[1-9]|[12]\d|3[01]))["

谢谢高手!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-11-7 03:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表