| 
 | 
 
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册  
 
x
 
 本帖最后由 a870950142 于 2022-11-12 18:12 编辑  
 
<div class="Clbc_top"> 
                        <div class="calist_mbx m-t-12"><a href="/">优美图库</a><span> > </span><h1><a href="/weimeitupian/">唯美图片</a></h1></div> 
                        <div class="taotu-nav"> 
                                <span><b> </b><h2><a href="/weimeitupian/oumeitupian/">欧美图片</a></h2></span> 
                                <a href="/weimeitupian/oumeitupian/"> 更多 </a> 
                        </div> 
                        <div class="taotu-main"> 
                                <ul> 
                                        <li> 
                                                <a href="/weimeitupian/oumeitupian/253312.htm 
 
从div class="Clbc_top"开始定位,寻找最下面a标签的href我该怎么写   
 
 
 
 
biao=main.find('div',class_="Clbc_top").find_all('a') 
这样写会把第二行的a找到,不想要那个a。哪位大佬帮帮忙啊~~~笨的要死! 
 
 
我的想法是在li的下面开始找a,定位得在Clbc_top这里
- import requests
 
 - from bs4 import BeautifulSoup
 
  
- url = "https://www.umei.cc/weimeitupian/"
 
  
- soup = BeautifulSoup(requests.get(url).text, 'lxml')
 
 - html_url = [each.find("a").get("href") for each in soup.find("div", class_="Clbc_top").find_all("li")]
 
 - print(html_url)
 
  复制代码 
 
 
 |   
 
 
 
 |