soup.find_all()
import urllib.requestfrom bs4 import BeautifulSoup
url = 'https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%C3%C0%C5%AE&fr=ala&ala=1&alatpl=cover&pos=0&hs=2&xthttps=111111'
response = urllib.request.urlopen(url)
html = response.read().decode('utf-8')
soup = BeautifulSoup(html,'lxml')
print(soup.body.div.div.div.div.div.ul)
print(soup.find_all(name=''))
怎么都获取不到想要的,怎么才能得到它(下面图片蓝色部分)
>>> soup.find_all(attrs={'class':'imgitem'})
[]
>>> soup.find_all(class_='imgitem')
[]
>>>
本帖最后由 qiuyouzhi 于 2020-8-24 20:01 编辑
https://www.cnblogs.com/cymwill/articles/7574479.html qiuyouzhi 发表于 2020-8-24 20:00
https://www.cnblogs.com/cymwill/articles/7574479.html
你最佳突破 1000 了{:10_257:} qiuyouzhi 发表于 2020-8-24 20:00
https://www.cnblogs.com/cymwill/articles/7574479.html
>>> soup.find_all(lambda tag:tag.has_attr('class') and tag.has_attr('data-objurl'))
[]
可是还是找不出来 def花 发表于 2020-8-24 20:10
可是还是找不出来
网页涉及js,建议用webdriver抓取 本帖最后由 1q23w31 于 2020-8-24 20:48 编辑
def花 发表于 2020-8-24 20:10
可是还是找不出来
用浏览器访问你的网址,关闭js后网页自动跳转到百度图片
1q23w31 发表于 2020-8-24 20:34
用浏览器访问你的网址,关闭js后网页自动跳转到百度图片
怎么关闭它? def花 发表于 2020-8-25 07:58
怎么关闭它?
浏览器设置里找找可以禁用js 或者找个有这个功能的插件
页:
[1]