爬虫 previous_sibling 的问题,Python交流,编程语言专区,鱼C论坛

CarlCar 发表于 2022-4-28 17:36:24

爬虫 previous_sibling 的问题

# 当网站的下方页码如下时，采用两次 previous_sibling，网上说 previous_sibling 的作用是找向前最近的一个兄弟节点，如何更好的理解呢？

<前页1 2 3 4 5 6 7 8 9 10后页>(共250条)

# 代码如下
def find_depth(res):
soup = BeautifulSoup(res.text, "html.parser")

# previous_sibling.previous_sibling.text 找向前最近的兄弟节点（不理解）
depth = soup.find("span", class_="next").previous_sibling.previous_sibling.text
return int(depth)

Twilight6 发表于 2022-4-28 20:20:15

简单说就是返回调用此属性的节点对象的前一个兄弟节点，看看这个例子：

<body>
<div class="box1">
   ...
</div>
<div class="box2">
   ...
</div>
<div class="box3">
   ...
</div>
<div class="box4">
   ...
</div>
</body>

box4 的前一个兄弟节点是box3 ，box3 的前一个兄弟节点是 box2 ...... 以此类推

若 soup.find("div", class_="box4") 此时获取到的是第四个 div 节点，即 class = "box4"

对此节点对象，调用一次 previous_sibling 则返回的就是第四个 div 节点紧跟着的兄弟节点，即 class = "box3"的 div 节点

若对第四个 div 节点调用两次 previous_sibling 就相当于对第三个节点调用一次 previous_sibling

页: [1]

鱼C论坛's Archiver

爬虫 previous_sibling 的问题