|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
想問 findall 出來的列表要如何得到像group的指令
in : b=re.search(r'(http://www(.)\d+(.)com/ent.+?html)',htm)
out: ('http://www.27270.com/ent/rentiyishu/2017/237972.html', '.', '.')
in: b.group()後得到: out: 'http://www.27270.com/ent/rentiyishu/2017/237972.html' 沒錯
in: a=re.findall(r'(http://www(.)\d+(.)com/ent.+?html)', htm)
a為一個列表,要如何提取一個像b.group出來
a[0]為('http://www.27270.com/ent/rentiyishu/2017/237972.html', '.', '.') 為元祖
a[0][0]才是b.group()後的,感覺不太正統,有其他辦法?,謝謝
還沒完成,以下程式碼得到:
- import os
- import urllib.request
- import re
- url='http://www.27270.com/ent/rentiyishu/'
- req=urllib.request.Request(url)
- req.add_headers=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36')]
- responese=urllib.request.urlopen(url)
- htm=responese.read().decode('gbk')
- #http://www.27270.com/ent/rentiyishu/2017/237972.html
- #http://www.27270.com/ent/rentiyishu/2017/226972.html
- #http://www.27270.com/ent/rentiyishu/2017/227976.html
- #獲取進入此網站之分頁(還沒到圖片網頁,到網頁只需要找分頁和原始網頁)
- a=re.findall(r'(http://www(.)\d+(.)com/ent.+?html)', htm)
- b=re.search(r'(http://www(.)\d+(.)com/ent.+?html)',htm)
- b.group()
- print(a[0])
复制代码
|
|