鱼C论坛

 找回密码
 立即注册
查看: 2087|回复: 4

[已解决]急!!一个正则表达式的问题

[复制链接]
发表于 2016-3-27 13:27:35 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
抓取一个HTML的图片地址,我想匹配 http开头,jpg或者png结尾的 地址:
http:// ....   .jpg|png

我是这样写的                r_img = r'((?:http).+(?:jpg|png))'

但是每次都会匹配到以下字符串:

http://fifa.sgamer.com/"><img class="lazy" src="javascript:;" data-original="http://game.gtimg.cn/images/fifa/web201509/img25.jpg

前面的都是多余的。我只想要        http://game.gtimg.cn/images/fifa/web201509/img25.jpg  。

应该怎样书写?

求指导啊 。。
最佳答案
2016-3-27 14:24:45
stopit 发表于 2016-3-27 13:53
r'((?:http).+?(?:jpg|png))'请问,是这样吗?

可是还是不行耶。

那就换个思路, 图片的顶级域名是不变的, 把
  1. http://game.gtimg.cn/images/
复制代码
加进正则, 再匹配
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2016-3-27 13:43:22 | 显示全部楼层
  1. .+?
复制代码

在量词后面加上?表示懒惰匹配
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-3-27 13:53:15 | 显示全部楼层
hldh214 发表于 2016-3-27 13:43
在量词后面加上?表示懒惰匹配


r'((?:http).+?(?:jpg|png))'请问,是这样吗?

可是还是不行耶。

依然会匹配到
http://ol.gamersky.com/z/fifaonline3/"><img class="lazy" src="javascript:;" data-original="http://game.gtimg.cn/images/fifa/web201509/img15.jpg
我只想要:http://game.gtimg.cn/images/fifa/web201509/img15.jpg
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2016-3-27 14:24:45 | 显示全部楼层    本楼为最佳答案   
stopit 发表于 2016-3-27 13:53
r'((?:http).+?(?:jpg|png))'请问,是这样吗?

可是还是不行耶。

那就换个思路, 图片的顶级域名是不变的, 把
  1. http://game.gtimg.cn/images/
复制代码
加进正则, 再匹配
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2016-3-27 14:51:14 | 显示全部楼层
hldh214 发表于 2016-3-27 14:24
那就换个思路, 图片的顶级域名是不变的, 把加进正则, 再匹配

这样可以的 。
但是我还是想知道遇到这种情况:

http://xxxxxxxxxxxxhttp://xxxxxxxxxx.jpg 如果只想取得后半段 应该怎样书写。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-10-14 03:12

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表