关于一个return函数的问题
写了一个用selenium爬取漫画的程序,但是各函数传递参数是很多用的是列表(只是因为有一个命名没有想出好办法),但是image_loc函数中的be_need没有办法正确传出参数(因为这个be_need的值在函数中是一个循环里的值,当然没法弄出来{然后我又想着说把be_nee在做一个列表(但是那样就没办法实时看到图片有没有被下载)})希望大佬们给点改进这个代码的意见,还有小白想问下大佬们是如何把list循环中的结果传出的(我现在基本就是list.append,传个列表出来,然后再遍历,好像没什么好办法)小白写的破烂代码,大佬轻喷(只是第一章的内容爬取)
from selenium import webdriver
from lxml import etree
import time
import os
import requests
##文件夹创建
if os.path.exists("F:\python7"):
pass
else:
os.mkdir("F:\python7")
##图片储存函数
def save_image (be_need,listm):
for m in listm:
need = requests.get(be_need)
with open(f"F:\python7/{m}.jpg","wb") as f:
f.write(need.content)
##获取url对应的图片地址
def image_loc(listurl):
for url in listurl:
driver=webdriver.Firefox()
get_=driver.get(url)
html=driver.page_source
time.sleep(2)
a=str(html).find("http://image.mangabz.com")
b=str(html).find('" style="cursor: ')
be_need=str(html)
#print(be_need)
#print(f"获取网页{be_need}")
driver.close()
return (be_need)
##生成正确的url
def url_make(a,b):
url_f="http://www.mangabz.com/m19"
url_add1=str(a)+"/"
listm=[]
listurl=[]
for i in range(1,b+1):
url_add2="#ipg"+str(i)
listm.append(i)
listurl.append(url_f+url_add1+url_add2)
return listurl,listm
listurl,listm=url_make(894,44)
print(f"已生成所要爬取列表{listurl}")
beneed=image_loc(listurl)
print(f"测试输出{beneed}")
save_image(beneed,listm) ? class mangabz:
url = "http://image.mangabz.com/1/430/19894/{}" # {}缺少页码编号
jpg_params = {
"cid": "19894",
"key": "40b7dead39f489ec4b0c2212e793b1f2",
"uk": ""
}
ajax_api = "http://www.mangabz.com/m19894/chapterimage.ashx?"
api_params = {
"cid": "19894",
"page": "0",
"key": "",
"_cid": "19894",
"_mid": "430",
"_dt": "2020-08-09 21:46:28",
"_sign": "2c617649c5b75aefa56a28c91cd6ad1c"
}
def get_nex_page(self, page):
# 根据页码,获取当前页码的编号,以及下一个页码的编码
self.api_params["page"] = page
response = requests.get(self.ajax_api, params=self.api_params)
pages = re.findall("\d{1,2}_\d{4,5}", response.text)
self.pt_jpg_url(pages)
def pt_jpg_url(self, pages):
on, next = pages
print(self.url.format(on))
print(self.url.format(next))
if __name__ == '__main__':
t = mangabz()
t.get_nex_page(1) 所以,问题是??? 陈尚涵 发表于 2020-8-10 10:37
所以,问题是???
所以我的问题是,函数中有一个循环,但是循环不结束是无法返回函数遍历的所有值的,就是说return最后会返回最后一次赋值的值。我想要他返回所有的个体,所以我说我原来是在循环中进行append操作最后return列表,
但是我想要他返回每一次的个体,就是在函数输入一个列表,然后函数负责对列表中的元素进行操作后,持续返回操作后的每个个体(小白表述能力真的不好,希望能被理解)
页:
[1]