鱼C论坛

 找回密码
 立即注册
查看: 1769|回复: 7

[已解决]新人求助!xpath寻找标签一直返回的是空列表?尝试了很多方法还是不行

[复制链接]
发表于 2020-3-6 23:38:09 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
由于爬取的是好看视频,页面里面提取超清视频的链接,但是用xpath搜索标签,无论是完整的路径还是复制谷歌的xpath路径,返回的都是空列表
responses = requests.get(url_video,headers=headers)
    data_res = responses.text
    html_ele = etree.HTML(data_res)
    url = html_ele.xpath('/html/body/div/div/div[1]/div[1]/div/hk-controls/hk-definition/ul/li[3]')
    print(title)


额 无法上传图片只能贴个地址https://haokan.baidu.com/v?pd=pc&vid=14996104587974757183
我寻找的是视频超清MP4链接,总共那个标签下有3个,但是XPATH返回总是为空,新手刚学不知道是什么问题
最佳答案
2020-3-7 12:39:23
zouyin 发表于 2020-3-7 12:01
额 新人自学不太明白,所以就用xpath提取。应该在network里面取是么?

https://fishc.com.cn/forum.php?mod=viewthread&tid=159479&extra=page%3D1&mobile=2
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2020-3-7 07:31:22 | 显示全部楼层
视频的一些信息  比如URL 啥的  都是动态添加到网页上的
xpath 累死你也爬不到的  
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-7 10:33:30 | 显示全部楼层
视频连接放在了js中 动态加载出来的
所以你需要用正则去取内容
{'key': 'sd', 'rank': 0, 'title': '标清', 'url': 'https://vdept.bdstatic.com/4e7a525131394b417943386a4d393446/434348336a424b45/50459996a442e3288333a266754cc582694703a72bcd37159dda3ae131146150241bb44cb8b5c7bf4695779175f6877ceb117fd93970fb91a4ac5ce5492c8f8b.mp4?auth_key=1583555481-0-0-db6c288564e0861f297d74760169b96c', 'videoBps': 342, 'vodVideoHW': '360$640', 'videoSize': 34.3, 'vodMoovSize': 672331, 'video_clarity_score': 5.7134}
{'key': 'hd', 'rank': 1, 'title': '高清', 'url': 'https://vdept.bdstatic.com/51695670777653395056413369323539/7242666243456b64/f1673d28f6fac3bce0c8c77ef2ef9322bf6c21840827fa7914f66a5f1769789f4ce2e63e22819d771091757a379c62021b49d6c03c6effd68d31f9012e198f9f.mp4?auth_key=1583555481-0-0-289d6ada663f95bcf37856d218348e73', 'videoBps': 472, 'vodVideoHW': '480$852', 'videoSize': 47.3, 'vodMoovSize': 671283, 'video_clarity_score': 5.9481}
{'key': 'sc', 'rank': 2, 'title': '超清', 'url': 'https://vdept.bdstatic.com/53486e38555a326c597a625154377850/5752765268626a76/44c7e6541f47beda1182a4cd1bdaba596b205fbf5a3219eecb53e88db86c7aa09f1215c3379eaaf6dc324a58b5ea6a62a3e3e915f8fb03ea8aa702231c1bd050.mp4?auth_key=1583555481-0-0-4e79de99ad50b24178d8d22cb92cb642', 'videoBps': 839, 'vodVideoHW': '720$1280', 'videoSize': 84, 'vodMoovSize': 675254}
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-7 11:59:23 | 显示全部楼层
yjsx86 发表于 2020-3-7 10:33
视频连接放在了js中 动态加载出来的
所以你需要用正则去取内容

请问这是在network里面找的么?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-7 12:01:55 | 显示全部楼层
wp231957 发表于 2020-3-7 07:31
视频的一些信息  比如URL 啥的  都是动态添加到网页上的
xpath 累死你也爬不到的

额 新人自学不太明白,所以就用xpath提取。应该在network里面取是么?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-7 12:39:23 From FishC Mobile | 显示全部楼层    本楼为最佳答案   
zouyin 发表于 2020-3-7 12:01
额 新人自学不太明白,所以就用xpath提取。应该在network里面取是么?

https://fishc.com.cn/forum.php?mod=viewthread&tid=159479&extra=page%3D1&mobile=2
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-3-7 12:43:09 From FishC Mobile | 显示全部楼层
zouyin 发表于 2020-3-7 12:01
额 新人自学不太明白,所以就用xpath提取。应该在network里面取是么?

是的
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-3-7 16:43:28 | 显示全部楼层
wp231957 发表于 2020-3-7 12:39
https://fishc.com.cn/forum.php?mod=viewthread&tid=159479&extra=page%3D1&mobile=2

感谢大神解答,谢谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-1-23 11:21

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表