为什么会出现错误帮忙看一下谢谢

caiheng2019 · 发表于 2019-8-10 19:09:14

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

这是代码

import requests
import re
from lxml import etree
import os
def download_pics(url):
response = requests.get(url,headers=headers)
base_link = etree.HTML(response.text).xpath('//div[@class="main-image"]//img/@src')[0][0:-6]
page_info = etree.HTML(response.text).xpath('//div[@class="pagenavi"]//span/text()')
max_page = int(page_info[-2])
for i in range(1,max_page+1):
page = str(i).zfill(2)
download_link = base_link+str(page)+'.jpg'
response = requests.get(download_link)
pic_name = download_link[-9:-4]
print('目前第{}套妹子,共{}张正在下载第{} 张图片......'.format (list_cnt,max_page,i))
with open(save_path+'\\'+pic_name+'.jpg','wb') as f:
f.write(response.content)
def get_list(url):
global list_cnt,save_path
list_cnt = 1
response = requests.get(url,headers=headers)
p = r'<a href="(https://www.mzitu.com/\d+)" target="_blank">'
list_pool = re.findall(p,response.text)
for li in list_pool:
save_path = '美女图\\EP'+str(list_cnt).zfill(3)
if not os.path.exists(save_path):
os.mkdir(save_path)
download_pics(url)
list_cnt+=1
def main():
if not os.path.exists('美女图'):
os.mkdir('美女图')
os.startfile('美女图')
get_list(url)
if __name__=="__main__":
url = 'https://www.mzitu.com/'
headers = {'user-agent': 'Mozilla/5.0'}
main()

复制代码

出现错误  Traceback (most recent call last):
  File "C:\Users\Administrator\Desktop\新建文本文档 (3).py", line 42, in <module>
main()
  File "C:\Users\Administrator\Desktop\新建文本文档 (3).py", line 37, in main
get_list(url)
  File "C:\Users\Administrator\Desktop\新建文本文档 (3).py", line 30, in get_list
download_pics(url)
  File "C:\Users\Administrator\Desktop\新建文本文档 (3).py", line 8, in download_pics
base_link = etree.HTML(response.text).xpath('//div[@class="main-image"]//img/@src')[0][0:-6]
IndexError: list index out of range
[Finished in 1.6s]

傻纸 · 发表于 2019-8-10 21:42:32

你看你这两句类名是不是写错了

base_link = etree.HTML(response.text).xpath('//div[@class="main-image"]//img/@src')[0][0:-6]
page_info = etree.HTML(response.text).xpath('//div[@class="pagenavi"]//span/text()')

复制代码

用print(response.text)可以查看网页的html，这里面找不到你指定的main-image和pagenavi这两个类
lxml库没怎么用过，不知道对不对

Stubborn · 发表于 2019-8-10 23:05:52

base_link = etree.HTML(response.text).xpath('//div[@class="main-image"]//img/@src')[0][0:-6]
base_link = etree.HTML(response.text).xpath('//div[@class="main-image"]//img/@src')
print(base_link)
print(type(base_link ))

复制代码

去掉后面的截取，和[0],先确认获得的是什么对象

账号		自动登录	找回密码
密码			立即注册

为什么 会出现 错误 帮忙看一下 谢谢

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块

为什么会出现错误帮忙看一下谢谢