鱼C论坛

 找回密码
 立即注册
查看: 2688|回复: 5

[已解决]关于正则表达式的应用有个问题

[复制链接]
发表于 2017-1-3 23:48:43 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import urllib.request
  2. import re
  3. url = 'http://tieba.baidu.com/p/3823765471'
  4. req = urllib.request.urlopen(url)
  5. html = req.read().decode('utf-8')
  6. p = r'<img class = "BDE_Image". *?src="[^"]*\.jpg".*?>'
  7. imglist = re.findall(p,html)
  8. for each in imglist:
  9.     print(each)
复制代码


为什么我用运行这段代码总是不返回东西呢,pycharm不返回,idle也没反应,为什么最后的print没用呢???求教
最佳答案
2017-1-4 08:55:23
看你代码的意图是匹配图片地址,你把正则改一下:
p = r'<img class = "BDE_Image". *?src=(.*?)\.jpg".*?>'

再试试
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-1-4 06:36:51 From FishC Mobile | 显示全部楼层
你的正则表达式写得不对吧。没有捕获的内容当然不显示了。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-1-4 08:55:23 | 显示全部楼层    本楼为最佳答案   
看你代码的意图是匹配图片地址,你把正则改一下:
p = r'<img class = "BDE_Image". *?src=(.*?)\.jpg".*?>'

再试试
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2017-1-4 10:05:46 | 显示全部楼层
p = r'<img class="BDE_Image".*?src="[^"]*\.jpg".*?>'
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2017-1-4 12:29:25 | 显示全部楼层

谢谢,改成你的代码就对了,发现错误的原因是多了两个space
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2017-1-4 12:30:13 | 显示全部楼层
jerryxjr1220 发表于 2017-1-4 06:36
你的正则表达式写得不对吧。没有捕获的内容当然不显示了。

恩,正则表达式多了两个space,所以没捕获到东西,就没显示东西了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-24 19:33

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表