正则表达式求解答
需要把网址提取出来,但是试过各种都不能完整提出来,是什么原因呢?import re
str = '<a href="http://news.nankai.edu.cn/ywsd/system/2021/12/02/030049242.shtml" target="_blank">校领导为物理科学学院本科生讲授“形势与政策”课</a>'
res = re.search(r'(https?|ftp|file)(:/)?/[-A-Za-z0-9+&@#/%?=~_|!:,.;]*',str)
print(res)
import re
str = '<a href="http://news.nankai.edu.cn/ywsd/system/2021/12/02/030049242.shtml" target="_blank">校领导为物理科学学院本科生讲授“形势与政策”课</a>'
res = re.search(r'(https?|ftp|file)(:/)?/[-A-Za-z0-9+&@#/%?=~_|!:,.;]*',str)
print(res)
你要的就是href="...."里面的链接,所以
>>> re.search(r'<a href="(.*?)"', str).group(1) 阿奇_o 发表于 2021-12-3 23:04
你要的就是href="...."里面的链接,所以
那请问下为什么我删掉group(1)之后网址就匹配不全呢?分组一定要跟group连用吗
页:
[1]