python爬虫遇到问题，大神请进

李易峰 · 发表于 2018-7-24 16:43:19

您需要登录才可以下载或查看，没有账号？立即注册

x

import requests
from bs4 import BeautifulSoup
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'}
r = requests.get('http://www.qiushibaike.com', headers = headers)
content = r.text
soup = BeautifulSoup(r.text, 'lxml')
divs = soup.find_all(class_ = 'article block untagged mb15')
print(divs)

复制代码

这个错误是输出[]空列表

luckin · 发表于 2018-7-24 18:10:16

你看你截图的蓝色选中的部分后面还有内容
改成divs = soup.find_all(class_ = 'article block untagged mb15 typs_recent')

零度非安全 · 发表于 2018-7-24 20:40:13

你这样是匹配不到的，因为这个属性有多个值，解决办法用 xpath 最容易，如下：

import requests
from lxml import etree
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'}
r = requests.get('http://www.qiushibaike.com', headers = headers)
content = r.text
soup = etree.HTML(content)
divs = soup.xpath('//div[contains(@class, "article")]')
print(divs)

复制代码

账号		自动登录	找回密码
密码			立即注册