鱼C论坛

 找回密码
 立即注册
查看: 5124|回复: 6

爬取极客学院视频!!

[复制链接]
发表于 2015-7-24 12:07:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x

  1. import re
  2. import requests

  3. head = {
  4.             'Accept':'*/*',
  5.             'Accept-Encoding':'identity;q=1, *;q=0',
  6.             'Accept-Language':'zh-CN,zh;q=0.8',
  7.             'Connection':'keep-alive',
  8.             'Host':'183.136.233.190',
  9.             'Range':'bytes=0-',
  10.             'Referer':'http://www.jikexueyuan.com/course/202.html',
  11.             'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.152 Safari/537.36',
  12.         }

  13. ##一定要写返回值是206(部分内容)的request

  14. url = 'http://www.jikexueyuan.com/course/202.html'
  15. r = requests.head(url,headers = head,stream=True)

  16. if (r.status_code == requests.codes.ok):
  17.     print(r.headers['content-type'])
  18. ##确认响应类型



  19. print(r.headers)
  20. print(r.text)
复制代码


就是爬取不到响应头   该怎么返回general值呢
就是那个视频连接地址!
无标题.png
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2015-7-25 11:29:33 | 显示全部楼层
  1. import re
  2. import requests

  3. head = {
  4.             'Accept':'*/*',
  5.             'Accept-Encoding':'identity;q=1, *;q=0',
  6.             'Accept-Language':'zh-CN,zh;q=0.8',
  7.             'Connection':'keep-alive',
  8.             'Host':'cv3.jikexueyuan.com',
  9.             'Range':'bytes=0-',
  10.             'Referer':'http://www.jikexueyuan.com/course/202.html',
  11.             'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/42.0.2311.152 Safari/537.36',
  12.         }

  13. ##一定要写返回值是206(部分内容)的request




  14. url = 'http://cv3.jikexueyuan.com/201507251126/92e18f8217dfd1491e5af9eac50acf34/python/course_jbyf/01/video/c202b_01_h264_sd_960_540.mp4'
  15. r = requests.head(url,headers = head,stream=True)

  16. if (r.status_code == 302):
  17.     url = r.headers['location']
  18.     print(url)
  19.     res = requests.head(url,headers = head,stream=True)
  20.     print(res.status_code)
  21. ##确认响应类型
复制代码

评分

参与人数 1荣誉 +5 鱼币 +5 收起 理由
~风介~ + 5 + 5 支持楼主!

查看全部评分

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2015-7-24 20:22:30 | 显示全部楼层
{:1_1:}
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2015-7-24 21:16:10 From FishC Mobile | 显示全部楼层
这么牛叉
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-7-25 11:30:50 | 显示全部楼层
至于这个地址怎么来的  你自己从那个教程的网址 找吧 http://cv3.jikexueyuan.com/201507251126/92e18f8217dfd1491e5af9eac50acf34/python/course_jbyf/01/video/c202b_01_h264_sd_960_540.mp4
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-7-28 14:45:01 | 显示全部楼层
ddddddddddddddddddddddddddddd
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2015-7-29 10:48:28 | 显示全部楼层
这都可以啊 极客学院不是要收费的吗
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-2-16 22:03

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表