真是努力,凌晨还在学习。
虽然你标的已经解决了,我还是说下我的方法吧,毕竟很多新来的童鞋不一定知道怎么提取这样的标签。因为我也是这样踩坑过来的。
- <span class="ellipsis vip">
 
 复制代码 
如果把条件限制为ellipsis,实际上会把这两个span标签都选择出来,原因在于<span class="ellipsis vip">实际上存在多个class属性,ellipsis和vip都是它的class属性,只不过用空格分开了。如果用css选择器的话,设置class="ellipsis"或者class="vip"都会将第一条提取出来。
但如果只设定class="ellipsis"条件,又会把第二条筛选出来。
限定提取第一条信息
- from bs4 import BeautifulSoup
 
- html = '<span class="ellipsis vip">'
 - soup = BeautifulSoup(html,'lxml')
 - results = soup.select('.ellipsis.vip')
 - for result in results:
 -     print(result)
 
 复制代码