|
50鱼币
本帖最后由 Stubborn 于 2019-1-27 04:51 编辑
秉承着学习的态度看了下多线程。加上之前刚刚好找一个网站练手,于是继续拿那个网站练手,遇到一些问题,有指教的不甚感激。主要是下载不到数据。提取什么的都正常。
为什么下载不了下载不了,解析都OK的
剔除保存图片的代码,可以正常循环,不剔除代码块只循环一次,就过了
思路很简单,代码如下:
- def save_img(self,img_number,img_url,title):
- "图集下载"
- headers = {
- 'User-Agent': ua.random,
- 'Referer': 'http://i.meizitu.net'
- }
- for i in range(1,int(img_number)+1):
- # print("当前正在工作的线程是:{},正在解析{}图集,地址是{}".format(self.thread_id, title,img_url))
- img_subset_url = img_url + "/%s" % i
- print("当前正在工作的线程是:{},正在解析{}图集,地址是{}".format(self.thread_id, title, img_subset_url))
- img_url = etree.HTML(requests.get(img_subset_url,headers=headers).text)
- img_save_url = img_url.xpath('//div[@class="main-image"]/p/a/img/@src')[0] #图片下载地址
- img_name = '%s\\' % title + img_url.split('/')[-1]
- #开始下载图片
- response = requests.get(img_save_url, headers=headers)
- with open(img_name,"wb") as f:
- f.write(response.content)
复制代码
|
|