|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
一个简单的爬取爱奇艺视频连接的代码
解析接口使用的时BL接口,视频名字暂定"二十不惑"(懒得改了)
- # -*- coding: utf-8 -*-
- import requests
- import re
- import json
- # import sys
- # if len(sys.argv) == 1:
- # print("请输入关键字进行搜索")
- # exit(0)
- # keyword = sys.argv[1]
- keyword = '二十不惑'
- url = 'https://so.iqiyi.com/so/q_' + keyword
- parse_url = 'https://vip.bljiex.com/?v='
- # UA使用手机端
- headers = {
- 'user-agent':
- 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Mobile Safari/537.36 Edg/84.0.522.52'
- }
- session = requests.session()
- r = session.get(url, headers=headers)
- data = re.findall('window.__INITIAL_STATE__=(.*?);\(function', r.text)
- dict_data = json.loads(data[0])
- # print(dict_data)
- result = dict_data.get('search').get('searchResult').get('docs')
- for each in result:
- title = each.get('albumTitle')
- print(title)
- info = each.get('videoinfos')
- for i in info:
- item = {
- 'itemTitle': i.get('itemTitle'),
- 'itemLink': parse_url + i.get('itemLink'),
- }
- print(item)
- print('\n')
复制代码
|
|