find_all()
1.result = soup.find_all(itemprop="dateUpdate")2.result = soup.find_all(name="description")
为什么第一个可以查找出来,第二个就不行,只能result = soup.find_all(attrs={"name":"description")定制属性查找?
import urllib.request
from bs4 import BeautifulSoup
import re
from urllib.parse import quote
url = f'http://baike.baidu.com/item/{quote("百度")}/6699'
response = urllib.request.urlopen(url)
html = response.read()
html = html.decode("utf-8")
soup = BeautifulSoup(html,"html.parser")
result = soup.find_all(itemprop="dateUpdate")#就是这儿
for each in result:
print(each)
find_all( name , attrs , recursive , string , **kwargs )
find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件
name是这个方法的默认参数
name的使用
这是最简单而直接的一种办法了,我么可以通过html标签名来索引;
sb = soup.find_all('img')
你的第二个result = soup.find_all(name="description") beautifulsoup就认为是查找名为description的标签,也就找不到,所以只能构造result = soup.find_all(attrs={"name":"description")来查找 1q23w31 发表于 2020-8-21 09:14
name是这个方法的默认参数
name的使用
秒懂
页:
[1]