鱼C论坛

 找回密码
 立即注册
查看: 3187|回复: 1

[技术交流] 爱奇艺视频解析

[复制链接]
发表于 2020-8-11 13:23:29 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
        一个简单的爬取爱奇艺视频连接的代码
解析接口使用的时BL接口,视频名字暂定"二十不惑"(懒得改了)
  1. # -*- coding: utf-8 -*-
  2. import requests
  3. import re
  4. import json
  5. # import sys

  6. # if len(sys.argv) == 1:
  7. #     print("请输入关键字进行搜索")
  8. #     exit(0)
  9. # keyword = sys.argv[1]
  10. keyword = '二十不惑'

  11. url = 'https://so.iqiyi.com/so/q_' + keyword
  12. parse_url = 'https://vip.bljiex.com/?v='
  13. # UA使用手机端
  14. headers = {
  15.     'user-agent':
  16.         'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Mobile Safari/537.36 Edg/84.0.522.52'
  17. }
  18. session = requests.session()
  19. r = session.get(url, headers=headers)
  20. data = re.findall('window.__INITIAL_STATE__=(.*?);\(function', r.text)
  21. dict_data = json.loads(data[0])
  22. # print(dict_data)
  23. result = dict_data.get('search').get('searchResult').get('docs')
  24. for each in result:
  25.     title = each.get('albumTitle')
  26.     print(title)
  27.     info = each.get('videoinfos')
  28.     for i in info:
  29.         item = {
  30.             'itemTitle': i.get('itemTitle'),
  31.             'itemLink': parse_url + i.get('itemLink'),
  32.         }
  33.         print(item)
  34.     print('\n')
复制代码

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-8-16 23:39:44 | 显示全部楼层
怎么用
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-25 22:09

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表