鱼C论坛

 找回密码
 立即注册
查看: 1589|回复: 1

[已解决]新手請教~~re.findall問題

[复制链接]
发表于 2017-11-2 16:37:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
想問  findall  出來的列表要如何得到像group的指令



in : b=re.search(r'(http://www(.)\d+(.)com/ent.+?html)',htm)

out:  ('http://www.27270.com/ent/rentiyishu/2017/237972.html', '.', '.')

in:  b.group()後得到: out:  'http://www.27270.com/ent/rentiyishu/2017/237972.html'  沒錯



in:  a=re.findall(r'(http://www(.)\d+(.)com/ent.+?html)', htm)

a為一個列表,要如何提取一個像b.group出來

a[0]為('http://www.27270.com/ent/rentiyishu/2017/237972.html', '.', '.') 為元祖

a[0][0]才是b.group()後的,感覺不太正統,有其他辦法?,謝謝

還沒完成,以下程式碼得到:




  1. import os
  2. import urllib.request
  3. import re

  4. url='http://www.27270.com/ent/rentiyishu/'

  5. req=urllib.request.Request(url)
  6. req.add_headers=[('User-Agent','Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/61.0.3163.100 Safari/537.36')]
  7. responese=urllib.request.urlopen(url)
  8. htm=responese.read().decode('gbk')

  9. #http://www.27270.com/ent/rentiyishu/2017/237972.html
  10. #http://www.27270.com/ent/rentiyishu/2017/226972.html
  11. #http://www.27270.com/ent/rentiyishu/2017/227976.html
  12. #獲取進入此網站之分頁(還沒到圖片網頁,到網頁只需要找分頁和原始網頁)
  13. a=re.findall(r'(http://www(.)\d+(.)com/ent.+?html)', htm)
  14. b=re.search(r'(http://www(.)\d+(.)com/ent.+?html)',htm)
  15. b.group()
  16. print(a[0])
复制代码
最佳答案
2017-11-2 17:04:02
没有,需要双重索引才能获得
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2017-11-2 17:04:02 | 显示全部楼层    本楼为最佳答案   
没有,需要双重索引才能获得
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-28 06:35

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表