|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
一句正则表达式实现
代码
a = '''
<div class="paginator">\n<span class="prev">\n <前页\n </span>\n<span class="thispage">1</span>\n<a href="?start=25&filter=">2</a>\n<a href="?start=50&filter=">3</a>\n<a href="?start=75&filter=">4</a>\n<a href="?start=100&filter=">5</a>\n<a href="?start=125&filter=">6</a>\n<a href="?start=150&filter=">7</a>\n<a href="?start=175&filter=">8</a>\n<a href="?start=200&filter=">9</a>\n<a href="?start=225&filter=">10</a>\n<span class="next">\n<link href="?start=25&filter=" rel="next">\n<a href="?start=25&filter=">后页></a>\n</link></span>\n<span class="count">(共250条)</span>\n</div>
'''
b = r'>\d+<'
for i in m:
print(i.span())
prnt(i.group())
效果
(102, 105)
>1<
(143, 146)
>2<
(181, 184)
>3<
(219, 222)
>4<
(258, 261)
>5<
(297, 300)
>6<
(336, 339)
>7<
(375, 378)
>8<
(414, 417)
>9<
(453, 457)
>10<
>>>
提取所有 ">1<" 两个尖括号中的内容 不包括尖括号
|
|