忄亙 发表于 2024-4-20 01:31:22

求大神们解下,谢了,怎么改

本帖最后由 忄亙 于 2024-4-20 01:58 编辑

res = requests.get(url,headers=wz)
from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text,'lxml')
lis = soup.find_all('li',class_='col-4')
for li in lis:
    a = li.find_all('a')
    地址 = a.get('href')
    标题 = a.text


AttributeError: ResultSet object has no attribute 'get'. You're probably treating a list of items like a single item. Did you call find_all() when you meant to call find()?

不二如是 发表于 2024-4-20 01:31:23

你这里报错是因为:find_all('a') 返回的是列表(ResultSet),但你后面把它当成单个标签来用 (a.get(...) / a.text)。

只取每个 <li> 里的第一个链接:

import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin

res = requests.get(url, headers=wz, timeout=10)
res.raise_for_status()

soup = BeautifulSoup(res.text, 'lxml')
lis = soup.find_all('li', class_='col-4')

data = []
for li in lis:
    a = li.find('a', href=True)   # 用 find() 返回单个元素
    if not a:
      continue
    地址 = urljoin(url, a['href']) # 兼容相对链接
    标题 = a.get_text(strip=True)
    data.append({'标题': 标题, '地址': 地址})

print(data)

FishC 发表于 2024-4-20 01:31:47

这个错误是因为你把BeautifulSoup的find_all()方法返回的结果当作了一个单独的元素来处理,而实际上它返回的是一个列表。在这种情况下,你不能直接使用.get()方法。

要解决这个问题,你需要遍历这个返回的列表,然后再对每个元素使用.get()方法。下面是一个示例代码:

from bs4 import BeautifulSoup

# 假设你已经用BeautifulSoup解析了一个HTML网页,并找到了所有的<a>标签
a_tags = soup.find_all('a')

# 遍历<a>标签列表
for a_tag in a_tags:
    # 对于每个<a>标签,使用.get()方法获取想要的属性值
    href = a_tag.get('href')
    text = a_tag.get_text()
   
    # 打印属性值
    print("链接地址:", href)
    print("文本内容:", text)

这样,你就能正确地获取到每个<a>标签的属性值了。

希望这能帮到你!如果还有其他问题,请随时提问。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

冲浪的口香糖 发表于 2025-8-19 09:46:20

res = requests.get(url,headers=wz)
from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text,'lxml')
lis = soup.find_all('li',class_='col-4')
for li in lis:
    a = li.find_all('a')
    <font color="#ff0000">地址</font> = a.get('href')
    <font color="#ff0000">标题</font> = a.text变量不能用中文命名{:10_282:}

666999666999 发表于 2025-8-19 14:35:29

冲浪的口香糖 发表于 2025-8-19 09:46
变量不能用中文命名

py3支持中文命名了{:10_254:}

冲浪的口香糖 发表于 2025-8-19 15:53:24

666999666999 发表于 2025-8-19 14:35
py3支持中文命名了

挖丢,我现在才知道{:10_257:},那我就找不出问题了,我没学过bs4和requests库{:10_327:}

爱编程的我 发表于 2025-8-21 21:12:36

冲浪的口香糖 发表于 2025-8-19 15:53
挖丢,我现在才知道,那我就找不出问题了,我没学过bs4和requests库

真的
页: [1]
查看完整版本: 求大神们解下,谢了,怎么改