鱼C论坛

 找回密码
 立即注册
查看: 3153|回复: 2

[已解决]循环翻页后覆盖了第一次循环的数据,怎么接着往下保存

[复制链接]
发表于 2022-6-2 10:00:26 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. #地址 #翻页
  2. 总共页面=300

  3. for page in range(1,总共页面):

  4.     url=f'https://www.amazon.de/s?k=Bathroom+Storage&i=kitchen&rh=p_72%3A419118031%2Cp_n_availability%3A419126031&dc&page={page}&__mk_de_DE=%C3%85M%C3%85%C5%BD%C3%95%C3%91&qid=1653973729&rnid=419124031&ref=sr_pg_2'


  5.     #1.发送请求
  6.     res = requests.get(url=url,headers=headers)
  7.     conter= res.content.decode('utf-8')
  8.     select= Selector(text=conter)
  9.     divs = select.css('.a-section.a-spacing-base')
  10.     wz1="https://www.amazon.de/"



  11.     #创建表格
  12.     workbook= xlwt.Workbook(encoding='utf-8')
  13.     worksheet=workbook.add_sheet('1',cell_overwrite_ok=True)
  14.     rowDatas=['1','2','3','4']
  15.     for t in range(0,len(rowDatas)):
  16.         worksheet.write(0,t,rowDatas[t],)
  17.     workbook.save("C:\\Users\Administrator\Desktop\2\1.xls")

  18.     # 二级页面 提取列表
  19.     i=0
  20.     for div in divs:       
  21.         i=i+1       
  22.         wz=(div.css('.a-link-normal.s-no-outline::attr(href)').get())
  23.         wz=urljoin(wz1,str(wz))
  24.         resp= requests.get(wz,headers=headers)
  25.         conter= resp.content.decode('utf-8')
  26.         select= Selector(text=conter)

  27.         #二级页面数据提取
  28.         data = select.xpath('.//a[@id="bylineInfo"]/text()').extract_first

  29.         #正则
  30.         data1 = re.compile(r"data='(.+?)'")
  31.         data=str(data)
  32.         data2 = data1.search(data)
  33.         if data2==None:
  34.             data2=('空')
  35.         else:
  36.             data2 = data2.group(1)



  37.     #保存数据到表格

  38.         worksheet.write(i,0,data2)

  39.         workbook.save("C:\\Users\Administrator\Desktop\2\1.xls")
复制代码


现在的情况是爬取主页有24个二级链接
循环第一遍翻页依次把二级页面提取的数据保存到表格至A1-A24
循环第二遍翻页后又把A1-A24的数据给覆盖了
循环第一次翻页i=24 我循环翻页后 i又等于0了  又保存数据到A1-A24了把之前的覆盖了  怎么把数据接着往下保存
最佳答案
2022-6-2 19:17:08

可以在循环外设置个列表,每次循环往里加数据,最后一次性写入文件

你每次循环读一次文件,效率比较差,相对前者只是节省了些内存

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2022-6-2 19:17:08 | 显示全部楼层    本楼为最佳答案   

可以在循环外设置个列表,每次循环往里加数据,最后一次性写入文件

你每次循环读一次文件,效率比较差,相对前者只是节省了些内存

小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-6-3 09:17:00 | 显示全部楼层
Twilight6 发表于 2022-6-2 19:17
可以在循环外设置个列表,每次循环往里加数据,最后一次性写入文件

你每次循环读一次文件,效率比较差 ...

谢谢版主,思路一下子清晰了
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-24 01:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表