Maplea 发表于 2023-2-21 00:51:56

怎么选择指定的a标签

其他的span中只有一个a标签但这个有两个a标签
我想获取第二个a标签中的title值,但是爬虫会爬取第一个然后报错,有什么办法能指定我想要的a标签,
title_list = soup.select(".l3.a3")
outws.cell(row=index, column=3, value=str(title_list.select('a')["title"]))

wp231957 发表于 2023-2-21 07:59:56

这需要你发布网页的地址

ouyunfu 发表于 2023-2-21 08:48:55

可以通过在select方法中指定CSS选择器来获取你需要的第二个a标签的title值。例如,假设第二个a标签的CSS类是“.second-a”,你可以这样做:title_list = soup.select(".l3.a3")
outws.cell(row=index, column=3, value=str(title_list.select('.second-a')["title"]))
在上面的代码中,".second-a"是第二个a标签的CSS类选择器,它将只选择具有该CSS类的a标签,并从中获取title值。这样你就可以获取你想要的a标签中的title值了。

isdkz 发表于 2023-2-21 10:10:25

title_list = soup.select(".l3.a3")
outws.cell(row=index, column=3, value=str(title_list.select('a')["title"]))

cflying 发表于 2023-2-21 11:03:59

几个方法:
1、使用兄节点语句
2、全部找出,然后判断没有target属性的就是,或者直接[]最后一个

Maplea 发表于 2023-2-21 11:36:10

wp231957 发表于 2023-2-21 07:59
这需要你发布网页的地址

http://guba.eastmoney.com/list,600745,f_732.html

Maplea 发表于 2023-2-21 13:00:14

怎么选择有title属性的a标签啊?

isdkz 发表于 2023-2-21 18:23:17

Maplea 发表于 2023-2-21 13:00
怎么选择有title属性的a标签啊?

import requests
from bs4 import BeautifulSoup

url = 'http://guba.eastmoney.com/list,600745,f_732.html'
resp = requests.get(url)
soup = BeautifulSoup(resp.text, 'html.parser')
for i in soup.select('a'):
    print(i.get('title'))
   
页: [1]
查看完整版本: 怎么选择指定的a标签