求大神们解下,谢了,怎么改
本帖最后由 忄亙 于 2024-4-20 01:58 编辑res = requests.get(url,headers=wz)
from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text,'lxml')
lis = soup.find_all('li',class_='col-4')
for li in lis:
a = li.find_all('a')
地址 = a.get('href')
标题 = a.text
AttributeError: ResultSet object has no attribute 'get'. You're probably treating a list of items like a single item. Did you call find_all() when you meant to call find()?
你这里报错是因为:find_all('a') 返回的是列表(ResultSet),但你后面把它当成单个标签来用 (a.get(...) / a.text)。
只取每个 <li> 里的第一个链接:
import requests
from bs4 import BeautifulSoup
from urllib.parse import urljoin
res = requests.get(url, headers=wz, timeout=10)
res.raise_for_status()
soup = BeautifulSoup(res.text, 'lxml')
lis = soup.find_all('li', class_='col-4')
data = []
for li in lis:
a = li.find('a', href=True) # 用 find() 返回单个元素
if not a:
continue
地址 = urljoin(url, a['href']) # 兼容相对链接
标题 = a.get_text(strip=True)
data.append({'标题': 标题, '地址': 地址})
print(data) 这个错误是因为你把BeautifulSoup的find_all()方法返回的结果当作了一个单独的元素来处理,而实际上它返回的是一个列表。在这种情况下,你不能直接使用.get()方法。
要解决这个问题,你需要遍历这个返回的列表,然后再对每个元素使用.get()方法。下面是一个示例代码:
from bs4 import BeautifulSoup
# 假设你已经用BeautifulSoup解析了一个HTML网页,并找到了所有的<a>标签
a_tags = soup.find_all('a')
# 遍历<a>标签列表
for a_tag in a_tags:
# 对于每个<a>标签,使用.get()方法获取想要的属性值
href = a_tag.get('href')
text = a_tag.get_text()
# 打印属性值
print("链接地址:", href)
print("文本内容:", text)
这样,你就能正确地获取到每个<a>标签的属性值了。
希望这能帮到你!如果还有其他问题,请随时提问。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 res = requests.get(url,headers=wz)
from bs4 import BeautifulSoup
soup = BeautifulSoup(res.text,'lxml')
lis = soup.find_all('li',class_='col-4')
for li in lis:
a = li.find_all('a')
<font color="#ff0000">地址</font> = a.get('href')
<font color="#ff0000">标题</font> = a.text变量不能用中文命名{:10_282:} 冲浪的口香糖 发表于 2025-8-19 09:46
变量不能用中文命名
py3支持中文命名了{:10_254:} 666999666999 发表于 2025-8-19 14:35
py3支持中文命名了
挖丢,我现在才知道{:10_257:},那我就找不出问题了,我没学过bs4和requests库{:10_327:} 冲浪的口香糖 发表于 2025-8-19 15:53
挖丢,我现在才知道,那我就找不出问题了,我没学过bs4和requests库
真的
页:
[1]