鱼C论坛

 找回密码
 立即注册
查看: 1794|回复: 2

[已解决]爬汽车之家-媳妇当车模 遇到问题

[复制链接]
发表于 2017-4-8 22:25:39 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
》环境:Win7,语言:Python3

import requests
from bs4 import BeautifulSoup
import os

headers = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/57.0.2987.133 Safari/537.36"}
all_url = 'http://club.autohome.com.cn/jingxuan/104'
start_html = requests.get(all_url,headers=headers)

Soup = BeautifulSoup(start_html.text,'lxml')
a_list = Soup.find('ul', class_='content').find_all('a')

for a in a_list:
    title = a.get_text()
    href = a['href']
    print(title,href)

》输出结果不够精简
微信截图_20170408221642.png

》网页结构
111.png


请问如何只获得title 和img src里面的信息
最佳答案
2017-4-8 22:47:06
本帖最后由 gopythoner 于 2017-4-8 22:50 编辑

如果要只获得一次,那就改成下面这样:
  1. Soup = BeautifulSoup(start_html.text,'lxml')
  2. a_list = Soup.find('ul', class_='content').find_all('div',class_="pic-box")

  3. for a in a_list:
  4.     title = a.find("a").get("title")
  5.     href = a.find("a").get("href")
  6.     print(title,href)
复制代码


输出
  1. 都是我的爱 清纯女神与红马拍大片 http://club.autohome.com.cn/bbs/thread-c-66-61878366-1.html#pvareaid=102410
  2. 相识相爱到相知 贤惠妻子的翼虎秀 http://club.autohome.com.cn/bbs/thread-c-2863-61952974-1.html#pvareaid=102410
  3. “驭”见情人 老司机的前世与今生 http://club.autohome.com.cn/bbs/thread-c-2228-61839134-1.html#pvareaid=102410
  4. 女司机要上路了 甜美媳妇的车模秀 http://club.autohome.com.cn/bbs/thread-c-4171-61964273-1.html#pvareaid=102410
  5. 大马小马都是爱 阳光下的气质女神 http://club.autohome.com.cn/bbs/thread-c-3968-61844509-1.html#pvareaid=102410
  6. 一起攻略美食地图 看我的吃货女神 http://club.autohome.com.cn/bbs/thread-o-200111-61813879-1.html#pvareaid=102410
  7. 荒野“嘉”人 傲娇女神展迷人身姿 http://club.autohome.com.cn/bbs/thread-c-3870-61826254-1.html#pvareaid=102410
  8. 其实并不矛盾 贤惠妻子与酷炫战车 http://club.autohome.com.cn/bbs/thread-c-121-61755856-1.html#pvareaid=102410
  9. 香车配美女 素颜娇妻遇见帅气大白 http://club.autohome.com.cn/bbs/thread-c-4080-61716999-1.html#pvareaid=102410
复制代码
1212.png
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2017-4-8 22:41:04 | 显示全部楼层
我在你的这一句改了一点点,输出结果就变简单了
a_list = Soup.find('ul', class_='content').find_all('a',{"title":True})
后面
title = a.get("title")
href = a.get("href")
不过每个结果都输出了两次,因为你找的这个a标签是有2个的,一模一样的2个,如果你只想要其中一个的话,应该先从a的上层标签开始找
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

发表于 2017-4-8 22:47:06 | 显示全部楼层    本楼为最佳答案   
本帖最后由 gopythoner 于 2017-4-8 22:50 编辑

如果要只获得一次,那就改成下面这样:
  1. Soup = BeautifulSoup(start_html.text,'lxml')
  2. a_list = Soup.find('ul', class_='content').find_all('div',class_="pic-box")

  3. for a in a_list:
  4.     title = a.find("a").get("title")
  5.     href = a.find("a").get("href")
  6.     print(title,href)
复制代码


输出
  1. 都是我的爱 清纯女神与红马拍大片 http://club.autohome.com.cn/bbs/thread-c-66-61878366-1.html#pvareaid=102410
  2. 相识相爱到相知 贤惠妻子的翼虎秀 http://club.autohome.com.cn/bbs/thread-c-2863-61952974-1.html#pvareaid=102410
  3. “驭”见情人 老司机的前世与今生 http://club.autohome.com.cn/bbs/thread-c-2228-61839134-1.html#pvareaid=102410
  4. 女司机要上路了 甜美媳妇的车模秀 http://club.autohome.com.cn/bbs/thread-c-4171-61964273-1.html#pvareaid=102410
  5. 大马小马都是爱 阳光下的气质女神 http://club.autohome.com.cn/bbs/thread-c-3968-61844509-1.html#pvareaid=102410
  6. 一起攻略美食地图 看我的吃货女神 http://club.autohome.com.cn/bbs/thread-o-200111-61813879-1.html#pvareaid=102410
  7. 荒野“嘉”人 傲娇女神展迷人身姿 http://club.autohome.com.cn/bbs/thread-c-3870-61826254-1.html#pvareaid=102410
  8. 其实并不矛盾 贤惠妻子与酷炫战车 http://club.autohome.com.cn/bbs/thread-c-121-61755856-1.html#pvareaid=102410
  9. 香车配美女 素颜娇妻遇见帅气大白 http://club.autohome.com.cn/bbs/thread-c-4080-61716999-1.html#pvareaid=102410
复制代码

评分

参与人数 1荣誉 +5 鱼币 +5 贡献 +3 收起 理由
YHao + 5 + 5 + 3 感谢楼主无私奉献!

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-5-17 12:45

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表