|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
1.result = soup.find_all(itemprop="dateUpdate")
2.result = soup.find_all(name="description")
为什么第一个可以查找出来,第二个就不行,只能result = soup.find_all(attrs={"name":"description")定制属性查找?
- import urllib.request
- from bs4 import BeautifulSoup
- import re
- from urllib.parse import quote
- url = f'http://baike.baidu.com/item/{quote("百度")}/6699'
- response = urllib.request.urlopen(url)
- html = response.read()
- html = html.decode("utf-8")
- soup = BeautifulSoup(html,"html.parser")
- result = soup.find_all(itemprop="dateUpdate")#就是这儿
- for each in result:
- print(each)
复制代码
- find_all( name , attrs , recursive , string , **kwargs )
- find_all() 方法搜索当前tag的所有tag子节点,并判断是否符合过滤器的条件
复制代码
name是这个方法的默认参数
name的使用
- 这是最简单而直接的一种办法了,我么可以通过html标签名来索引;
- sb = soup.find_all('img')
复制代码
你的第二个result = soup.find_all(name="description") beautifulsoup就认为是查找名为description的标签,也就找不到,所以只能构造result = soup.find_all(attrs={"name":"description")来查找
|
|