鱼C论坛

 找回密码
 立即注册
查看: 2274|回复: 12

[技术交流] 写了一个bilibili下载视频的代码

[复制链接]
发表于 2020-5-4 10:16:31 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
我写了一个下载bilibili视频的代码
首先一个模块:danmaku2ass,在附件
用到这些模块:requests,time,hashlib,urllib.request,re,xml.dom.minidom,moviepy,os, sys, json
'''
项目: B站视频下载
'''
import danmaku2ass
import requests,time,hashlib,urllib.request,re
from xml.dom.minidom import parseString
from moviepy.editor import *
import os, sys, json,sys
#用户输入av号或者视频链接地址
print('*'*30 + 'B站视频下载小助手' + '*'*30)
start = input('请输入您要下载的B站av号或者视频链接地址:')
if start.isdigit() == True: #如果输入的是av号
    start_url = 'https://www.bilibili.com/video/av' + start
else:
    start_url = start

#视频质量
# <accept_format><![CDATA[flv,flv720,flv480,flv360]]></accept_format>
# <accept_description><![CDATA[高清 1080P,高清 720P,清晰 480P,流畅 360P]]></accept_description>
# <accept_quality><![CDATA[80,64,32,15]]></accept_quality>
quality = input('请输入您要下载视频的清晰度(1080p:80;720p:64;480p:32;360p:15)(填写80或64或32或15):')

#获取视频的cid,title
headers = {
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
}
html = requests.get(start_url,headers=headers).text
cid = re.search(r'cid=(\d+)&',html).group(1)
title = re.search(r'<h1 title="(.*?)" class="video-title"',html).group(1)
print('[下载视频的cid]:' +cid)
print('[下载视频的标题]:' + title)
# 清洗一下标题名称(不能有\ / : * ? " < > |)
title = re.sub(r'[\/\\:*?"<>|]', '', title)  # 替换为空的

#访问API地址
entropy = 'rbMCKn@KuamXWlPMoJGsKcbiJKUfkPF_8dABscJntvqhRSETg'
appkey, sec = ''.join([chr(ord(i) + 2) for i in entropy[::-1]]).split(':')
params = 'appkey=%s&cid=%s&otype=json&qn=%s&quality=%s&type=' % (appkey, cid, quality, quality)
chksum = hashlib.md5(bytes(params + sec, 'utf8')).hexdigest()
url_api = 'https://interface.bilibili.com/v2/playurl?%s&sign=%s' % (params, chksum)
headers = {
    'Referer':start_url,  #注意加上referer
    'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 Safari/537.36'
}
# print(url_api)
html = requests.get(url_api,headers=headers).json()
# print(json.dumps(html))
video_list = [html['durl'][0]['url']]
# print(video_list)

#下载视频
'''
urllib.urlretrieve 的回调函数:
def callbackfunc(blocknum, blocksize, totalsize):
    @blocknum:  已经下载的数据块
    @blocksize: 数据块的大小
    @totalsize: 远程文件的大小
'''


def Schedule_cmd(blocknum, blocksize, totalsize):
    speed = (blocknum * blocksize) / (time.time() - start_time)
    # speed_str = " Speed: %.2f" % speed
    speed_str = " Speed: %s" % format_size(speed)
    recv_size = blocknum * blocksize

    # 设置下载进度条
    f = sys.stdout
    pervent = recv_size / totalsize
    percent_str = "%.2f%%" % (pervent * 100)
    n = round(pervent * 50)
    s = ('#' * n).ljust(50, '-')
    f.write(percent_str.ljust(8, ' ') + '[' + s + ']' + speed_str)
    f.flush()
    # time.sleep(0.1)
    f.write('\r')


def Schedule(blocknum, blocksize, totalsize):
    speed = (blocknum * blocksize) / (time.time() - start_time)
    # speed_str = " Speed: %.2f" % speed
    speed_str = " Speed: %s" % format_size(speed)
    recv_size = blocknum * blocksize

    # 设置下载进度条
    f = sys.stdout
    pervent = recv_size / totalsize
    percent_str = "%.2f%%" % (pervent * 100)
    n = round(pervent * 50)
    s = ('#' * n).ljust(50, '-')
    print(percent_str.ljust(6, ' ') + '-'+ speed_str)
    f.flush()
    time.sleep(2)
    # print('\r')

# 字节bytes转化K\M\G
def format_size(bytes):
    try:
        bytes = float(bytes)
        kb = bytes / 1024
    except:
        print("传入的字节格式不对")
        return "Error"
    if kb >= 1024:
        M = kb / 1024
        if M >= 1024:
            G = M / 1024
            return "%.3fG" % (G)
        else:
            return "%.3fM" % (M)
    else:
        return "%.3fK" % (kb)

print('[正在下载,请稍等...]:' + title)
currentVideoPath = os.path.join(sys.path[0],'bilibili_video',title)  #当前目录作为下载目录
num = 1
for i in video_list:
    opener = urllib.request.build_opener()
    # 请求头
    opener.addheaders = [
        # ('Host', 'upos-hz-mirrorks3.acgvideo.com'),  #注意修改host,不用也行
        ('User-Agent', 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.13; rv:56.0) Gecko/20100101 Firefox/56.0'),
        ('Accept', '*/*'),
        ('Accept-Language', 'en-US,en;q=0.5'),
        ('Accept-Encoding', 'gzip, deflate, br'),
        ('Range', 'bytes=0-'),  # Range 的值要为 bytes=0- 才能下载完整视频
        ('Referer', start_url),  #注意修改referer,必须要加的!
        ('Origin', 'https://www.bilibili.com'),
        ('Connection', 'keep-alive'),
    ]
    urllib.request.install_opener(opener)
    #创建文件夹存放下载的视频
    if not os.path.exists(currentVideoPath):
        os.makedirs(currentVideoPath)
    #开始下载
    start_time = time.time()
    urllib.request.urlretrieve(url=i,filename=os.path.join(currentVideoPath,r'{}-{}.flv'.format(title,num)), reporthook=Schedule_cmd)  #写成mp4也行  title + '-' + num + '.flv'
    xmlpath=os.path.join(currentVideoPath,r'{}-{}.'.format(title,num))
    num +=1

#合并视频
if len(video_list) >= 2:
    #视频大于一段才要合并
    print('[下载完成,正在合并视频]')
    # 定义一个数组
    L = []
    # 访问 video 文件夹 (假设视频都放在这里面)
    root_dir = currentVideoPath
    # 遍历所有文件
    for file in sorted(os.listdir(root_dir), key=lambda x: int(x[x.rindex("-")+1:x.rindex(".")])):
        # 如果后缀名为 .mp4/.flv
        if os.path.splitext(file)[1] == '.flv':
             # 拼接成完整路径
             filePath = os.path.join(root_dir, file)
             # 载入视频
             video = VideoFileClip(filePath)
             # 添加到数组
             L.append(video)
    # 拼接视频
    final_clip = concatenate_videoclips(L)
    # 生成目标视频文件
    final_clip.to_videofile(os.path.join(root_dir,r'{}.mp4'.format(title)), fps=24, remove_temp=False)
    print('[视频合并完成]')

else:
    #视频只有一段则直接打印下载完成
    print('[下载完成]:' + title)
print("[获取弹幕]:"+title)
xmlurl='https://comment.bilibili.com/'+cid+'.xml'
x = requests.get(xmlurl)
with open(xmlpath+'xml',"wb")as code:
    code.write(x.content)
#urllib.request.urlretrieve(url=xmlurl,filename=os.path.join(currentVideoPath,r'{}.xml'.format(cid)))
#py=sys.path[5]+"\\python"
print("[弹幕转码]:调用danmaku2ass")
danmaku2ass.Danmaku2ASS(xmlpath+'xml',"autodetect",xmlpath+'ass',1920,1080,0,'MS PGothic',48,0.8,5,5,None,False)
#os.system(py+' .\\danmaku2ass.py -o ".\\'+title+'-'+str(num)+'.ass" -s 1920x1080 -fn MS PGothic -fs 48 -a 0.8 -dm 5 -ds 5 ".\\'+title+'-'+str(num)+'.xml"')
#拓展:分P视频:url相同,只是cid不同,通过url?p=1,2..分别找出每个分P的cid,带入请求得到下载地址
#如果是windows系统,下载完成后打开下载目录

danmaku2ass.zip

9.34 KB, 下载次数: 5

售价: 5 鱼币  [记录]  [购买]

模块

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-5-4 10:35:05 | 显示全部楼层
牛批
不过我们已经有you_get用了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-4 11:06:29 | 显示全部楼层
板凳……(面对大神瑟瑟发抖……
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-4 11:25:35 | 显示全部楼层
niubility!学习学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-4 12:20:41 | 显示全部楼层
kkk999de 发表于 2020-5-4 11:25
niubility!学习学习

牛逼lity,Chinglish
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-4 14:58:14 | 显示全部楼层
厉害厉害
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-4 22:39:31 | 显示全部楼层
不错
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-5-5 09:10:37 | 显示全部楼层
俩看下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-6 07:43:15 From FishC Mobile | 显示全部楼层
看看
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-5-6 08:02:34 | 显示全部楼层
谢谢分享
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-6 09:19:25 | 显示全部楼层
学习一下大神的作品
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-6 10:55:29 | 显示全部楼层
向大神学习
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-5-6 11:02:52 From FishC Mobile | 显示全部楼层
永恒的蓝色梦想 发表于 2020-5-4 12:20
牛逼lity,Chinglish

嘤glish
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-27 02:46

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表