鱼C论坛

 找回密码
 立即注册
查看: 845|回复: 1

[已解决]使用beautifulsoup的问题

[复制链接]
发表于 2018-2-4 18:51:45 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. >>> html_doc = """<html><head><title>睡鼠的故事</title></head>
  2. <body>
  3. <p class="title"><b>睡鼠的故事</b></p>
  4. <p class="story">从前有三位小姐姐,她们的名字是:
  5. <a href="http://example.com/elsie" class="sister" id="link1">埃尔西</a>,
  6. <a href="http://example.com/lacie" class="sister" id="link2">莱斯</a>和
  7. <a href="http://example.com/tillie" class="sister" id="link3">蒂尔莉</a>;
  8. 她们住在一个井底下面。</p>

  9. <p class="story">...</p>
  10. """
  11. >>> from bs4 import BeautifulSoup
  12. >>> soup = BeautifulSoup(html_doc, 'html.parser')
复制代码


看了小甲鱼老师的帮助文档,知道使用
  1. >>> soup.html.body.p
  2. <p class="title"><b>睡鼠的故事</b></p>
复制代码

得到body标签下第一个p标签的内容

请问有没有办法使用类似这样的代码
soup.html.body.p(class='story')
直接得到body标签下另一个p标签的内容?即返回
  1. <p class="story">从前有三位小姐姐,她们的名字是:
  2. <a href="http://example.com/elsie" class="sister" id="link1">埃尔西</a>,
  3. <a href="http://example.com/lacie" class="sister" id="link2">莱斯</a>和
  4. <a href="http://example.com/tillie" class="sister" id="link3">蒂尔莉</a>;
  5. 她们住在一个井底下面。</p>
复制代码
最佳答案
2018-2-6 18:06:40
  1. soup = BeautifulSoup(html_doc, "lxml")
  2. all_link = soup.find_all("p", attrs={"class": "story"})
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2018-2-6 18:06:40 | 显示全部楼层    本楼为最佳答案   
  1. soup = BeautifulSoup(html_doc, "lxml")
  2. all_link = soup.find_all("p", attrs={"class": "story"})
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-7 04:40

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表