好的,我们可以使用Python的requests库和BeautifulSoup库来进行网页爬取和数据提取。首先,我们需要安装这两个库:
- pip install requests
- pip install beautifulsoup4
- pip install openpyxl
复制代码
然后,我们编写下面的代码来实现爬取豆瓣音乐分类浏览下的流行相关数据,并将结果保存为Excel表格:
- import requests
- from bs4 import BeautifulSoup
- from openpyxl import Workbook
- # 发起HTTP GET请求并获取响应内容
- url = 'https://music.douban.com/tag/流行'
- response = requests.get(url)
- html = response.text
- # 使用BeautifulSoup解析HTML
- soup = BeautifulSoup(html, 'html.parser')
- # 查找音乐条目
- music_items = soup.find_all('div', class_='pl2')
- # 创建Excel表格
- workbook = Workbook()
- sheet = workbook.active
- # 添加表头
- sheet.append(['音乐名称', '表扬者', '音乐链接'])
- # 遍历音乐条目并提取数据
- for music_item in music_items:
- music_name = music_item.find('a').text.strip()
- praise = music_item.find('div', class_='pl').text.strip()
- music_link = music_item.find('a')['href']
-
- # 添加数据到Excel表格
- sheet.append([music_name, praise, music_link])
- # 保存Excel表格
- workbook.save('douban_music.xlsx')
复制代码
这样,我们就可以将豆瓣音乐分类浏览下的流行相关数据爬取下来,并保存为一个包含表头的Excel表格(douban_music.xlsx)。请确保在运行代码时已经安装了openpyxl库,用于处理Excel文件。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。