|
发表于 2023-8-22 10:31:35
|
显示全部楼层
您想要使用PyQuery从网页中提取第一个class为"title"的span标签的文本。在您给出的代码中,有一些错误导致了TypeError。
您可以按照以下方式修改代码:
- from pyquery import PyQuery
- import requests
- headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36 Edg/115.0.1901.203"}
- resp = requests.get("https://movie.douban.com/top250?start=0&filter=", headers=headers).text
- pq = PyQuery(resp)
- c = pq("span.title:first") # 选择第一个class为"title"的span标签
- text = c.text() # 获取文本内容
- print(text)
复制代码
这里的修改主要在以下几点:
1. 将pq.find("span.title")修改为pq("span.title:first"),使用CSS选择器选择第一个class为"title"的span标签。
2. 直接使用c.text()获取文本内容。
请注意,PyQuery中的选择器语法与CSS选择器类似,可以使用常见的CSS选择器语法来选择特定的元素。在这个例子中,我们使用:first伪类选择器来选取第一个匹配的元素。
如果问题已经解决,请设置最佳答案 |
|