鱼C论坛

 找回密码
 立即注册
查看: 947|回复: 3

[已解决]正则表达式求解答

[复制链接]
发表于 2021-12-3 22:53:56 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
需要把网址提取出来,但是试过各种都不能完整提出来,是什么原因呢?

import re
str = '<a href="http://news.nankai.edu.cn/ywsd/system/2021/12/02/030049242.shtml" target="_blank">校领导为物理科学学院本科生讲授“形势与政策”课</a>'
res = re.search(r'(https?|ftp|file)(:/)?/[-A-Za-z0-9+&@#/%?=~_|!:,.;]*',str)
print(res)
最佳答案
2021-12-3 23:04:14
你要的就是href="...."里面的链接,所以
  1. >>> re.search(r'<a href="(.*?)"', str).group(1)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2021-12-3 22:54:28 | 显示全部楼层
  1. import re
  2. str = '<a href="http://news.nankai.edu.cn/ywsd/system/2021/12/02/030049242.shtml" target="_blank">校领导为物理科学学院本科生讲授“形势与政策”课</a>'
  3. res = re.search(r'(https?|ftp|file)(:/)?/[-A-Za-z0-9+&@#/%?=~_|!:,.;]*',str)
  4. print(res)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-12-3 23:04:14 | 显示全部楼层    本楼为最佳答案   
你要的就是href="...."里面的链接,所以
  1. >>> re.search(r'<a href="(.*?)"', str).group(1)
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-12-4 09:23:33 | 显示全部楼层
阿奇_o 发表于 2021-12-3 23:04
你要的就是href="...."里面的链接,所以

那请问下为什么我删掉group(1)之后网址就匹配不全呢?分组一定要跟group连用吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-20 06:43

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表