鱼C论坛

 找回密码
 立即注册
查看: 1198|回复: 2

[已解决]提取内容

[复制链接]
发表于 2018-1-24 08:44:17 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
<a href="/%7B7XLFHHjg2I6Kp__TxZ1pZJrW8GkYk59CjoYrKZjaJeH8nWwYGxRgiPUbkfvCBTvIjn-Vi0vVdEUVNeunrgxs1KmBPYChDldqU1vsAE_N977195q-xOzIdWuMnIfNOOPJtgoOZlZLEzRJAPZP3bqnpeZ9LQPY_DMOLh_t9zkvhmZyHi-cBIToLo2mrY3xnga5acof2uNjmRBBT1BzH-Bsvg-1516695662810%7D"><div class="co1 ellipsis fl">北京醋溜网络科技股份有限公司</div></a>


这是爬虫下来得到的一个列表的第一个元素,我只想要元素中href后边的链接,用什么函数可以提取。求告知!!!!
最佳答案
2018-1-24 09:29:49
  1. import re
  2. text = 你上面这段
  3. info = re.findall(r'<a href="(.*?)"',text)[0]

  4. 正则表达式即可
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-1-24 09:15:04 | 显示全部楼层
a=s.spilt('=')
a[1]即为所需
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2018-1-24 09:29:49 | 显示全部楼层    本楼为最佳答案   
  1. import re
  2. text = 你上面这段
  3. info = re.findall(r'<a href="(.*?)"',text)[0]

  4. 正则表达式即可
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-6 06:25

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表