|
发表于 2021-3-14 15:19:31
|
显示全部楼层
本帖最后由 YunGuo 于 2021-3-14 17:07 编辑
最简单的代码:
- import requests
- from lxml import etree
- url = 'http://weixin.jiafenba.net/book/lesseons.action?b=ff80808163d2efe2016a28e59588310e#'
- header = {'user-agent': 'Mozilla/5.0'} # 定义user-agent伪装
- res = requests.get(url, headers=header) # 请求页面
- sel = etree.HTML(res.text) # 解析响应html
- datas = sel.xpath('/html/body/ul/li') # xpath获取所有li列表(datas是一个列表)
- for data in datas:
- name = data.xpath('@tiptitle')[0] # 获取标题
- mp3_url = 'http://weixin.jiafenba.net' + data.xpath('@filename')[0] # 获取MP3资源链接并组合成完整url
- mp3_res = requests.get(mp3_url) # 请求MP3资源
- with open(name + '.mp3', 'wb')as f:
- f.write(mp3_res.content) # mp3_res响应的二进制数据保存为MP3
- print(f'{name}下载完成!')
复制代码 |
|