|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
<div class="text _nO">
<a title="《败家子儿》 郭德纲 于谦" href="/sound/45982355">
<span class="title _nO">《败家子儿》 郭德纲 于谦</span>
</a>
</div>
不好意思不能发图片,网页代码如上
我想把“《败家子儿》 郭德纲 于谦” 它取出来
为什么我下面的爬虫语句的结果是个空值
曲目=解析.xpath('//div[@class="text _nO"]//span/text()')
这个是网的地址3个w.喜马拉雅的拼音.com/album/9723091
因为你要获取的数据是动态渲染出来的,我直接给你代码吧:
- import re
- import json
- import requests
- url = 'https://www.ximalaya.com/album/9723091'
- headers = {
- 'User-Agent': 'Mozilla/5.0'
- }
- resp = requests.get(url, headers=headers)
- data_str = re.search(r'window\.__INITIAL_STATE__ = ({.*?});', resp.text).group(1)
- data = json.loads(data_str)
- for i in data['store']['AlbumDetailTrackListV2']['tracksInfo']['tracks']:
- print(i['title'])
复制代码
|
|