[已解决]正则表达式求解答

specail · 发表于 2021-12-3 22:53:56

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

需要把网址提取出来，但是试过各种都不能完整提出来，是什么原因呢？

import re
str = '<a href="http://news.nankai.edu.cn/ywsd/system/2021/12/02/030049242.shtml" target="_blank">校领导为物理科学学院本科生讲授“形势与政策”课</a>'
res = re.search(r'(https?|ftp|file)(:/)?/[-A-Za-z0-9+&@#/%?=~_|!:,.;]*',str)
print(res)

最佳答案

月排行榜 / 总排行榜

阿奇_o

2021-12-3 23:04:14

你要的就是href="...."里面的链接，所以

>>> re.search(r'<a href="(.*?)"', str).group(1)

复制代码

跳转到最佳答案楼层

specail · 发表于 2021-12-3 22:54:28

import re
str = '<a href="http://news.nankai.edu.cn/ywsd/system/2021/12/02/030049242.shtml" target="_blank">校领导为物理科学学院本科生讲授“形势与政策”课</a>'
res = re.search(r'(https?|ftp|file)(:/)?/[-A-Za-z0-9+&@#/%?=~_|!:,.;]*',str)
print(res)

复制代码

阿奇_o · 发表于 2021-12-3 23:04:14

你要的就是href="...."里面的链接，所以

>>> re.search(r'<a href="(.*?)"', str).group(1)

复制代码

specail · 发表于 2021-12-4 09:23:33

阿奇_o 发表于 2021-12-3 23:04
你要的就是href="...."里面的链接，所以

那请问下为什么我删掉group(1)之后网址就匹配不全呢？分组一定要跟group连用吗

账号		自动登录	找回密码
密码			立即注册

[已解决]正则表达式求解答

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块