正则表达式求解答,Python交流,编程语言专区,鱼C论坛

specail 发表于 2021-12-3 22:53:56

正则表达式求解答

需要把网址提取出来，但是试过各种都不能完整提出来，是什么原因呢？

import re
str = '<a href="http://news.nankai.edu.cn/ywsd/system/2021/12/02/030049242.shtml" target="_blank">校领导为物理科学学院本科生讲授“形势与政策”课</a>'
res = re.search(r'(https?|ftp|file)(:/)?/[-A-Za-z0-9+&@#/%?=~_|!:,.;]*',str)
print(res)

specail 发表于 2021-12-3 22:54:28

import re
str = '<a href="http://news.nankai.edu.cn/ywsd/system/2021/12/02/030049242.shtml" target="_blank">校领导为物理科学学院本科生讲授“形势与政策”课</a>'
res = re.search(r'(https?|ftp|file)(:/)?/[-A-Za-z0-9+&@#/%?=~_|!:,.;]*',str)
print(res)

阿奇_o 发表于 2021-12-3 23:04:14

你要的就是href="...."里面的链接，所以
>>> re.search(r'<a href="(.*?)"', str).group(1)

specail 发表于 2021-12-4 09:23:33

阿奇_o 发表于 2021-12-3 23:04
你要的就是href="...."里面的链接，所以

那请问下为什么我删掉group(1)之后网址就匹配不全呢？分组一定要跟group连用吗

页: [1]

鱼C论坛's Archiver

正则表达式求解答