鱼C论坛

 找回密码
 立即注册
查看: 3109|回复: 2

[已解决]豆瓣爬虫疑问

[复制链接]
发表于 2022-12-20 15:08:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 fishhh03 于 2022-12-20 18:06 编辑
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

plt.rcParams['font.family']='SimHei'  #显示汉字
plt.rcParams['font.sans-serif'] = ['SimHei']

df = pd.read_excel('ans/豆瓣电影Top250_已预处理.xlsx')  #打开预处理后的数据文件
## 请在下面补充代码,实现:统计不同评分电影数量并输出、绘制柱形图 

## 补充代码结束
plt.show()
plt.savefig('step6/不同评分电影数量柱状图.png')

本关任务:编写一个程序,统计不同评分对应电影数量并绘制柱形图。
求问怎么做呀呜呜
最佳答案
2022-12-20 16:08:54
import requests
import os
import shutil

url="https://movie.douban.com/top250?start="
headers = #设置你自己浏览器的headers

def getWeb(url,i):
    try:  
       ## 请在下面补充代码,完成网页爬取及保存为txt文件
       dburl = url + str(i*25)
       r = requests.get(dburl)
       print(r.text)
       filename = 'step1/webpages/' + str(i) + ".txt"
       with open(filename, "w", errors="ignore") as f:
           f.write(r.text)
    except:
        print('爬取失败!')


def main():
    for i in range(10):
        getWeb(url,i)   #调用爬取网页的函数
        
## 以下为主程序
# 清理webpages文件夹中原有文件
fileset = os.listdir('step1/webpages')
for f in fileset:
    if 'web' in f:
        os.remove(os.path.join('step1/webpages',f))

# 调用主函数   
main()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-12-20 16:08:54 | 显示全部楼层    本楼为最佳答案   
import requests
import os
import shutil

url="https://movie.douban.com/top250?start="
headers = #设置你自己浏览器的headers

def getWeb(url,i):
    try:  
       ## 请在下面补充代码,完成网页爬取及保存为txt文件
       dburl = url + str(i*25)
       r = requests.get(dburl)
       print(r.text)
       filename = 'step1/webpages/' + str(i) + ".txt"
       with open(filename, "w", errors="ignore") as f:
           f.write(r.text)
    except:
        print('爬取失败!')


def main():
    for i in range(10):
        getWeb(url,i)   #调用爬取网页的函数
        
## 以下为主程序
# 清理webpages文件夹中原有文件
fileset = os.listdir('step1/webpages')
for f in fileset:
    if 'web' in f:
        os.remove(os.path.join('step1/webpages',f))

# 调用主函数   
main()
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-12-20 18:08:32 | 显示全部楼层

谢谢 我已经做出来刚刚那个啦
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-24 20:21

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表