鱼C论坛

 找回密码
 立即注册
查看: 2256|回复: 4

[作品展示] 爬虫--爬取小视频案例

[复制链接]
发表于 2019-3-3 16:37:30 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
#!/usr/bin/env python3.7
# _*_ coding: utf-8 _*_
# @Time   : 2019/3/315:03
# @Author : Stubbron
# @Email  : 1263270345@qq.com
#文件     :使用自定义模块.py
#IDE      :PyCharm
import requests
from fake_useragent import UserAgent
import time

ua = UserAgent() #随记生成User-Agent

def downloads(url,path):
    #开始下载的时间
    start = time.time()
    size = 0

    headers = {
        "User-Agent": ua.random
    }

    # stream 属性必须带上
    response = requests.get(url,headers=headers,stream=True)
    # print(response)
    #每次下次的数据大小
    chunk_size = 1024
    #视频总大小
    content_size = int(response.headers["content-length"])

    if response.status_code == 200:
        #文件读写
        with open(path,"wb") as f:
            #l浏览器发送给数据的数据
            for data in response.iter_content(chunk_size=chunk_size):
                #获取到的数据写入
                f.write(data)
                #已经下载的文件大小
                size += len(data)
                #进度条
                print("\r"+"[下载进度]:%s%.2f%%" %(">"*int(size * 50 / content_size),float(size / content_size * 100)),end= " ")
        #结束时间
        end = time.time()

        print("\n"+"视频下载完成 用时:{}".format(end - start))

def Thje_url(page):
    "通过API获取到视频的详细信息"
    uri = "http://api.vc.bilibili.com/board/v1/ranking/top?page_size=10&next_offset=&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc"
    url = "http://api.vc.bilibili.com/board/v1/ranking/top?page_size={}&next_offset=&tag=%E4%BB%8A%E6%97%A5%E7%83%AD%E9%97%A8&platform=pc".format(page)

    #模拟用户请求;添加请求头User-Agent
    headers = {
        "User-Agent": ua.random
    }

    #模拟用户请求网页
    sponse = requests.get(url,headers=headers).json()
    #通过data来取到最终的视频原址连接
    item = sponse.get("data").get("items")
    # print(item)
    for i in item:
        #得到item对应数据
        ite = i.get("item")
        # print(ite)
        #获取到视频标题
        Video_name = ite.get('description')
        #视频发布日期
        Video_time = ite.get('upload_time')

        #视频播放地址
        Video_bofang = ite.get('share_url')

        #视频下载地址
        Video_download = ite.get('video_playurl')

        #视频作者
        The_name = i.get('user').get('name')

        #获取到Url用来下载视频
        try:
            print("当前下载的是{}".format(Video_name))
            downloads(Video_download,path="{}.mp4".format(Video_name))
        except Exception as e:
            print(e)

for page in range(1,10):
    page += page * 10 + 1
    Thje_url(page)

本帖被以下淘专辑推荐:

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-3-6 09:24:23 | 显示全部楼层
楼主你好,那个网易云词语云的怎么看不了了
可以分想给我看看吗?
辛苦了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-6 16:32:48 | 显示全部楼层
杜若左 发表于 2020-3-6 09:24
楼主你好,那个网易云词语云的怎么看不了了
可以分想给我看看吗?
辛苦了

我记得有分享,不能看了?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-6 17:05:58 | 显示全部楼层
看不了了 呜呜呜呜~
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-6 17:08:19 | 显示全部楼层
可以发我QQ吗?3309701887
麻烦了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-24 12:58

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表