wcq15759797758 发表于 2021-6-26 21:57:07

requests与正则表达式 爬取一个视频

iimport requests          # 导入requests模块
import re                # 导入re模块
# 定义视频播放页面的url
url = 'http://site2.rjkflm.com:666/index/index/view/id/1.html'
# 定义请求头信息
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/83.0.4103.61 Safari/537.36'}
response = requests.get(url=url,headers=headers)   # 发送网络请求
if response.status_code==200:   # 判断请求成功后
    # 通过正则表达式匹配视频地址
    video_url = re.findall('<source src="(.*?)" type="video/mp4">',response.text)   #查找网页源代码
    video_url='http://site2.rjkflm.com:666/'+video_url    # 将视频地址拼接完整
    video_response = requests.get(url=video_url,headers=headers)# 发送下载视频的网络请求
    if video_response.status_code==200:    # 如果请求成功
      data = video_response.content      # 获取返回的视频二进制数据
      file =open('java视频.mp4','wb')    # 创建open对象
      file.write(data)                   # 写入数据
      file.close()                     # 关闭

{:10_254:}

fish_nian 发表于 2021-6-26 22:10:58

{:10_298:}可以,很不错

wcq15759797758 发表于 2021-6-26 22:29:35

fish_nian 发表于 2021-6-26 22:10
可以,很不错

谢谢支持

超级玛尼哄 发表于 2021-6-27 00:07:46

领币

龙舞九天 发表于 2021-6-27 06:27:31

{:5_95:}

hornwong 发表于 2021-6-27 18:19:43

{:5_95:}

懒狗李 发表于 2021-6-27 18:34:49

{:10_254:}

wuyifan001 发表于 2021-8-12 16:29:53

可以可以

skyree 发表于 2021-9-25 13:31:44

不错不错
页: [1]
查看完整版本: requests与正则表达式 爬取一个视频