设为首页收藏本站

切换到窄版

鱼C论坛»论坛 › 萌新训练营 › 萌新交流区 › 豆瓣爬虫疑问

发新帖

查看: 4471|回复: 2

[已解决]豆瓣爬虫疑问

发表于 2022-12-20 15:08:34 | 显示全部楼层 |阅读模式

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由 fishhh03 于 2022-12-20 18:06 编辑

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.family']='SimHei' #显示汉字
plt.rcParams['font.sans-serif'] = ['SimHei']
df = pd.read_excel('ans/豆瓣电影Top250_已预处理.xlsx') #打开预处理后的数据文件
## 请在下面补充代码，实现：统计不同评分电影数量并输出、绘制柱形图
## 补充代码结束
plt.show()
plt.savefig('step6/不同评分电影数量柱状图.png')

复制代码

本关任务：编写一个程序，统计不同评分对应电影数量并绘制柱形图。
求问怎么做呀呜呜

最佳答案

月排行榜 / 总排行榜

lxping

2022-12-20 16:08:54

import requests
import os
import shutil
url="https://movie.douban.com/top250?start="
headers = #设置你自己浏览器的headers
def getWeb(url,i):
try:
## 请在下面补充代码，完成网页爬取及保存为txt文件
dburl = url + str(i*25)
r = requests.get(dburl)
print(r.text)
filename = 'step1/webpages/' + str(i) + ".txt"
with open(filename, "w", errors="ignore") as f:
f.write(r.text)
except:
print('爬取失败！')
def main():
for i in range(10):
getWeb(url,i) #调用爬取网页的函数
## 以下为主程序
# 清理webpages文件夹中原有文件
fileset = os.listdir('step1/webpages')
for f in fileset:
if 'web' in f:
os.remove(os.path.join('step1/webpages',f))
# 调用主函数
main()

复制代码

跳转到最佳答案楼层

小甲鱼最新课程 -> https://ilovefishc.com

回复

使用道具举报

发表于 2022-12-20 16:08:54 | 显示全部楼层本楼为最佳答案

这个最佳答案由 lxping 给出，感谢 lxping 的回答。

单击隐藏图章

import requests
import os
import shutil
url="https://movie.douban.com/top250?start="
headers = #设置你自己浏览器的headers
def getWeb(url,i):
try:
## 请在下面补充代码，完成网页爬取及保存为txt文件
dburl = url + str(i*25)
r = requests.get(dburl)
print(r.text)
filename = 'step1/webpages/' + str(i) + ".txt"
with open(filename, "w", errors="ignore") as f:
f.write(r.text)
except:
print('爬取失败！')
def main():
for i in range(10):
getWeb(url,i) #调用爬取网页的函数
## 以下为主程序
# 清理webpages文件夹中原有文件
fileset = os.listdir('step1/webpages')
for f in fileset:
if 'web' in f:
os.remove(os.path.join('step1/webpages',f))
# 调用主函数
main()

复制代码

小甲鱼最新课程 -> https://ilovefishc.com

回复支持反对

使用道具举报

楼主| 发表于 2022-12-20 18:08:32 | 显示全部楼层

lxping 发表于 2022-12-20 16:08

谢谢我已经做出来刚刚那个啦

小甲鱼最新课程 -> https://ilovefishc.com

回复支持反对

使用道具举报

发新帖

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-9-21 06:25

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表