|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
各位大神好。本人小白一个。情况是这样的:可以爬到图片 但是爬下来的图片打开之后显示不了 图片大小也特别的小。
代码如下:
import requests
from bs4 import BeautifulSoup
import os
headers = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"}
all_url = 'http://www.360doc.com/content/14/0221/14/13773668_354483683.shtml'
start_html = requests.get(all_url, headers=headers)
Soup = BeautifulSoup(start_html.text, 'lxml')
all_a = Soup.find('ul', class_='tklist').find_all('a')
all_img = Soup.find('ul', class_='tklist').find_all('img')
for a in all_a:
title = a.get_text()
href = a['href']
#print(title, href)
for img in all_img:
img_alt = img['alt']
img_url = img['src']
print(img_alt,img_url)
path = str(img_alt).strip()
os.makedirs(os.path.join("D:\plants", path))
os.chdir("D:\plants\\"+path)
name = img_url[-9:-4]
imgs = requests.get(img_url, headers=headers)
f = open(name+'.jpg', 'ab')
f.write(imgs.content)
f.close() |
|