|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 丢丢yhj 于 2017-10-1 16:44 编辑
http://s.hc360.com/?w=%BB%A5%C1% ... D%AD%CA%A1&af=3
这个是慧聪网的 在解析href中发现这篇的最后一条链接解析不出来
//qs315net.b2b.hc360.com/shop/show.html
我目前用了parser lxml xml 都是缺少这一条的信息 但是在网站上又可以看到
用抓包软件看了,这个网址中没有出现异步加载了
- import requests
- from bs4 import BeautifulSoup as bs
- doc = requests.get('http://s.hc360.com/?w=%BB%A5%C1%AA%CD%F8&mc=enterprise&ee=4&z=%D6%D0%B9%FA%3A%D5%E3%BD%AD%CA%A1&af=3').content
- soup = bs(doc, 'html.parser')
- for link in soup.find_all('a'):
- print(link.get('href'))
复制代码
|
|