[已解决]提取内容

lebroncm · 发表于 2018-1-24 08:44:17

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

<a href="/%7B7XLFHHjg2I6Kp__TxZ1pZJrW8GkYk59CjoYrKZjaJeH8nWwYGxRgiPUbkfvCBTvIjn-Vi0vVdEUVNeunrgxs1KmBPYChDldqU1vsAE_N977195q-xOzIdWuMnIfNOOPJtgoOZlZLEzRJAPZP3bqnpeZ9LQPY_DMOLh_t9zkvhmZyHi-cBIToLo2mrY3xnga5acof2uNjmRBBT1BzH-Bsvg-1516695662810%7D"><div class="co1 ellipsis fl">北京醋溜网络科技股份有限公司</div></a>

这是爬虫下来得到的一个列表的第一个元素，我只想要元素中href后边的链接，用什么函数可以提取。求告知！！！！

最佳答案

月排行榜 / 总排行榜

gopythoner

2018-1-24 09:29:49

import re
text = 你上面这段
info = re.findall(r'<a href="(.*?)"',text)[0]
正则表达式即可

复制代码

跳转到最佳答案楼层

BngThea · 发表于 2018-1-24 09:15:04

a=s.spilt('=')
a[1]即为所需

gopythoner · 发表于 2018-1-24 09:29:49

这个最佳答案由 gopythoner 给出，感谢 gopythoner 的回答。

单击隐藏图章

import re
text = 你上面这段
info = re.findall(r'<a href="(.*?)"',text)[0]
正则表达式即可

复制代码

账号		自动登录	找回密码
密码			立即注册