鱼C论坛

 找回密码
 立即注册
查看: 2430|回复: 3

求解正则表达式为什么不能得到结果

[复制链接]
发表于 2015-6-2 16:14:56 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1.     p = re.compile(r'''<tr\sclass[^>]*>\s+
  2.                                    <td>[.\s]+</td>\s+
  3.                                    (<td>(.*)?</td>\s+)
  4.                                    (<td>(.*)?</td>\s+)
  5.                                    (<td>(.*)?</td>\s+)
  6.                                    (<td>(.*)?</td>\s+)
  7.                                    (<td>(.*)?</td>\s+)
  8.                                    (<td>(.*)?</td>\s+)
  9.                                 </tr>''',re.VERBOSE)
  10.     list1 = p.findall(r'''<tr class="odd">
  11.                                     <td>
  12.                                         <img>
  13.                                     </td>
  14.                                     <td>1.1.1.1</td>
  15.                                     <td>80</td>
  16.                                     <td>北京</td>
  17.                                     <td>高匿</td>
  18.                                     <td>HTTP</td>
  19.                                     <td>24</td>
  20.                                 </tr>''')
  21.     print(list1)
  22.     sys.exit()
复制代码


小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2015-6-2 16:41:21 | 显示全部楼层
自己解决了,原来是[]里面.和\s不能同时用
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2015-6-4 10:27:26 | 显示全部楼层
[.\s]+ 这里你是希望匹配空白和换行和任意字符.
对于xml html的正则解析, 一般使用模式:
MULTILINE
所以在你的例子里,应该使用: re.VERBOSE | re.MULTILINE | re.DOTALL
然后 [.\s]+ 这个可以直接变成  .+?
而且要使用非贪婪匹配.
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2015-6-6 00:14:30 | 显示全部楼层
混鱼币混鱼币混鱼币混鱼币混鱼币混鱼币:lol::lol::lol:
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-16 08:01

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表