鱼C论坛

 找回密码
 立即注册
查看: 897|回复: 1

采用 DrissionPage库,如何获取里面的内容?

[复制链接]
发表于 2024-7-25 10:19:12 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
采用 DrissionPage库,我要它的 @href 和 @title 的值,如例子应该怎样写?

例子:
  1. eles = page('#ul').eles('t:a')  # 获取左上角导航栏内所有<a>元素
  2. for ele in eles.filter.displayed():  # 筛选出显示的元素列表并逐个打印文本
  3.     print(ele.text, end=' ')
复制代码


要获取的内容:
  1. <ul>
  2.     <li><div class="content">
  3.             <a class="recommend normal" href="/#/train-new/class-detail/912951da-f7d9-426d-8626-d1f1d63d74ae" target="_blank" itemid="912951da-f7d9-426d-8626-d1f1d63d74ae">
  4.                 <div class="img">
  5.                     <div class="img-cont more-layout-img" style="background-image:url(/default/M00/E1/DB/CtCgjGY504aAdjwjAAGmUAd-XGQ370.jpg)">
  6.                         <img src="images/home/16-9.png">
  7.                     </div>
  8.                 </div>
  9.                 <div class="text-overflow title">学习网上专题培训班</div>
  10.                 <div class="bottom">
  11.                     <div class="item" title="浏览人次"><i class="iconfont icon-view"></i>59225</div>
  12.                     <!--  .sub-text.small-font > i.iconfont.icon-view(title=string('home.default.more.layout.views')) + span > echo(browseCount) -->
  13.                 </div>
  14.             </a>
  15.     </div></li>
  16.     <li>......</li>
  17. </ul>
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2024-7-25 10:21:23 | 显示全部楼层
当然可以!使用 `DrissionPage` 库获取网页中元素的 `@href` 和 `@title` 属性非常简单。下面是一个通俗易懂且带点幽默味的示例代码,帮助你获取这些值:

首先,确保你已经安装了 `DrissionPage` 库。如果还没装,可以用以下命令进行安装:

  1. pip install drissionpage
复制代码


接下来,你可以使用如下代码来获取导航栏中的所有链接(带有 `@href` 和 `@title` 的元素):

  1. from drissionpage import DrissionPage

  2. # 创建一个页面对象
  3. page = DrissionPage()

  4. # 获取左上角导航栏内所有元素
  5. eles = page('#ul').eles('t:a')  # 这里假设 #ul 是你的导航栏的选择器

  6. # 遍历显示的元素
  7. for ele in eles.filter.displayed():
  8.     href = ele.get_attribute('href')  # 获取 @href 属性
  9.     title = ele.get_attribute('title')  # 获取 @title 属性
  10.     print(f"链接: {href}, 标题: {title}")  # 输出链接和标题
复制代码


在这个代码里,我们首先实例化一个 `DrissionPage` 对象,然后使用 CSS 选择器抓取左上角导航栏里的所有链接。接着我们筛选出显示的元素,并逐个获取它们的 `@href` 和 `@title` 属性。最后,我们把这些信息优雅地打印出来。

这样,你就能满意地看到每个链接及其标题了,就像鱼油早晨第一口带来的清新感一样!希望这个例子能帮助到你!如果还有其他问题,尽管问哦!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-21 14:49

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表