|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
》环境:Win7,语言:Python3
import requests
from bs4 import BeautifulSoup
import os
headers = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36"}
all_url = 'http://club.autohome.com.cn/jingxuan/104'
start_html = requests.get(all_url,headers=headers)
Soup = BeautifulSoup(start_html.text,'lxml')
a_list = Soup.find('ul', class_='content').find_all('a')
for a in a_list:
title = a.get_text()
href = a['href']
print(title,href)
》输出结果不够精简
》网页结构
请问如何只获得title 和img src里面的信息
本帖最后由 gopythoner 于 2017-4-8 22:50 编辑
如果要只获得一次,那就改成下面这样:
- Soup = BeautifulSoup(start_html.text,'lxml')
- a_list = Soup.find('ul', class_='content').find_all('div',class_="pic-box")
- for a in a_list:
- title = a.find("a").get("title")
- href = a.find("a").get("href")
- print(title,href)
复制代码
输出
- 都是我的爱 清纯女神与红马拍大片 http://club.autohome.com.cn/bbs/thread-c-66-61878366-1.html#pvareaid=102410
- 相识相爱到相知 贤惠妻子的翼虎秀 http://club.autohome.com.cn/bbs/thread-c-2863-61952974-1.html#pvareaid=102410
- “驭”见情人 老司机的前世与今生 http://club.autohome.com.cn/bbs/thread-c-2228-61839134-1.html#pvareaid=102410
- 女司机要上路了 甜美媳妇的车模秀 http://club.autohome.com.cn/bbs/thread-c-4171-61964273-1.html#pvareaid=102410
- 大马小马都是爱 阳光下的气质女神 http://club.autohome.com.cn/bbs/thread-c-3968-61844509-1.html#pvareaid=102410
- 一起攻略美食地图 看我的吃货女神 http://club.autohome.com.cn/bbs/thread-o-200111-61813879-1.html#pvareaid=102410
- 荒野“嘉”人 傲娇女神展迷人身姿 http://club.autohome.com.cn/bbs/thread-c-3870-61826254-1.html#pvareaid=102410
- 其实并不矛盾 贤惠妻子与酷炫战车 http://club.autohome.com.cn/bbs/thread-c-121-61755856-1.html#pvareaid=102410
- 香车配美女 素颜娇妻遇见帅气大白 http://club.autohome.com.cn/bbs/thread-c-4080-61716999-1.html#pvareaid=102410
复制代码
|
-
|