|  | 
 
| 
本帖最后由 丢丢yhj 于 2017-10-1 16:44 编辑
x
马上注册,结交更多好友,享用更多功能^_^您需要 登录 才可以下载或查看,没有账号?立即注册  
 http://s.hc360.com/?w=%BB%A5%C1% ... D%AD%CA%A1&af=3
 这个是慧聪网的 在解析href中发现这篇的最后一条链接解析不出来
 //qs315net.b2b.hc360.com/shop/show.html
 我目前用了parser lxml xml 都是缺少这一条的信息 但是在网站上又可以看到
 用抓包软件看了,这个网址中没有出现异步加载了
 
 
复制代码import requests
from bs4 import BeautifulSoup as bs
doc = requests.get('http://s.hc360.com/?w=%BB%A5%C1%AA%CD%F8&mc=enterprise&ee=4&z=%D6%D0%B9%FA%3A%D5%E3%BD%AD%CA%A1&af=3').content
soup = bs(doc, 'html.parser')
for link in soup.find_all('a'):
    print(link.get('href'))
 | 
 |