def花 发表于 2020-8-24 19:59:28

soup.find_all()

import urllib.request
from bs4 import BeautifulSoup

url = 'https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gb18030&word=%C3%C0%C5%AE&fr=ala&ala=1&alatpl=cover&pos=0&hs=2&xthttps=111111'
response = urllib.request.urlopen(url)
html = response.read().decode('utf-8')
soup = BeautifulSoup(html,'lxml')

print(soup.body.div.div.div.div.div.ul)
print(soup.find_all(name=''))

怎么都获取不到想要的,怎么才能得到它(下面图片蓝色部分)
>>> soup.find_all(attrs={'class':'imgitem'})
[]
>>> soup.find_all(class_='imgitem')
[]
>>>

qiuyouzhi 发表于 2020-8-24 20:00:17

本帖最后由 qiuyouzhi 于 2020-8-24 20:01 编辑

https://www.cnblogs.com/cymwill/articles/7574479.html

liuzhengyuan 发表于 2020-8-24 20:10:36

qiuyouzhi 发表于 2020-8-24 20:00
https://www.cnblogs.com/cymwill/articles/7574479.html

你最佳突破 1000 了{:10_257:}

def花 发表于 2020-8-24 20:10:45

qiuyouzhi 发表于 2020-8-24 20:00
https://www.cnblogs.com/cymwill/articles/7574479.html

>>> soup.find_all(lambda tag:tag.has_attr('class') and tag.has_attr('data-objurl'))
[]
可是还是找不出来

1q23w31 发表于 2020-8-24 20:32:09

def花 发表于 2020-8-24 20:10
可是还是找不出来

网页涉及js,建议用webdriver抓取

1q23w31 发表于 2020-8-24 20:34:55

本帖最后由 1q23w31 于 2020-8-24 20:48 编辑

def花 发表于 2020-8-24 20:10
可是还是找不出来

用浏览器访问你的网址,关闭js后网页自动跳转到百度图片

def花 发表于 2020-8-25 07:58:41

1q23w31 发表于 2020-8-24 20:34
用浏览器访问你的网址,关闭js后网页自动跳转到百度图片

怎么关闭它?

1q23w31 发表于 2020-8-25 08:10:14

def花 发表于 2020-8-25 07:58
怎么关闭它?

浏览器设置里找找可以禁用js 或者找个有这个功能的插件
页: [1]
查看完整版本: soup.find_all()