|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
import re
import bs4
import requests
url='https://haokan.baidu.com/v?vid=9340172854313612982&tab=recommend&sfrom=recommend'
head={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.82 Safari/537.36'}
resp=requests.get(url,headers=head)
print(resp.text)
t=re.findall(r'http://.*?.mp4',resp.text)
print(t)
请问一下,我想把这个网页的视频全部爬下来,正则表达式也正确,但是结果返回空集,如何解决呀
本帖最后由 isdkz 于 2022-3-22 15:20 编辑
匹配 http:
t=re.findall(r'http:[^"]*?.mp4',resp.text)
匹配 https:
t=re.findall(r'https:[^"]*?.mp4',resp.text)
|
|