冰菲 发表于 2023-11-23 15:25:55

Python 处理Excel多个工作表合并一个工作表,从第二行开始合并,只保留首个表头

Python 处理Excel多个工作表合并一个工作表,从第二行开始合并,并且只保留首个表头,代码如何写?


path='C:/Users/EDY/Desktop/无密文件'
files_list=os.listdir(path)    #获取目标文件夹内各文件的名称
new_wb=Workbook()    #新建表格
new_ws=new_wb.active    #获取工作簿
for file in files_list:    #循环获取各表的名称
    file_path=path+'/'+file    #获取表格的路径
    wb=load_workbook(file_path)    #打开表格
    ws=wb.active    #打开工作簿
    for row in ws.iter_rows(min_row=2,values_only=True):    #、、、、、、、、循环获取表头以外的表格内容,从第1行开始就会有多个表头,从第2行开始就没有表头
      new_ws.append(row)    #获取的内容写入新表

new_wb.save("最终完整版/2023.11.23.xlsx")    #保存表格


FishC_GPT 发表于 2023-11-23 15:26:38

你的代码已经基本实现了合并多个Excel工作表为一个工作表,并从第二行开始合并内容。要保留首个表头,你需要在循环之前先将首个表头添加到新工作表中。具体代码如下:

from openpyxl import load_workbook, Workbook
import os

path = 'C:/Users/EDY/Desktop/无密文件'
files_list = os.listdir(path)# 获取目标文件夹内各文件的名称

new_wb = Workbook()# 新建表格
new_ws = new_wb.active# 获取工作簿

first_header_added = False# 是否已添加首个表头

for file in files_list:# 循环获取各表的名称
    file_path = path + '/' + file# 获取表格的路径
    wb = load_workbook(file_path)# 打开表格
    ws = wb.active# 打开工作簿

    for row_index, row in enumerate(ws.iter_rows(min_row=2, values_only=True)):
      if not first_header_added:
            new_ws.append(ws)# 添加首个表头
            first_header_added = True

      new_ws.append(row)# 获取的内容写入新表格

new_wb.save("最终完整版/2023.11.23.xlsx")# 保存表格

在代码中,我添加了一个`first_header_added`变量来判断是否已经添加了首个表头,这样就不会重复添加了。在内层循环中,如果是首个表头,就将其添加到新工作表中,并将`first_header_added`标记为`True`。然后继续将表格内容写入新工作表中。最后保存新的工作表。

希望能帮到你!
以上回复来自 -- ChatGPT(FishC官方接口),如未能正确解答您的问题,请继续追问。

isdkz 发表于 2023-11-23 16:35:31

你可以用一个变量来决定从第几行开始,这个变量代表表头是否已经添加

header_added = False
path='C:/Users/EDY/Desktop/无密文件'
files_list=os.listdir(path)    #获取目标文件夹内各文件的名称
new_wb=Workbook()    #新建表格
new_ws=new_wb.active    #获取工作簿
for file in files_list:    #循环获取各表的名称
    if not header_added:
      minr = 1
      header_added = True
    else:
      minr = 2
    file_path=path+'/'+file    #获取表格的路径
    wb=load_workbook(file_path)    #打开表格
    ws=wb.active    #打开工作簿
    for row in ws.iter_rows(min_row=minr,values_only=True):    #、、、、、、、、循环获取表头以外的表格内容,从第1行开始就会有多个表头,从第2行开始就没有表头
      new_ws.append(row)    #获取的内容写入新表

new_wb.save("最终完整版/2023.11.23.xlsx")    #保存表格
页: [1]
查看完整版本: Python 处理Excel多个工作表合并一个工作表,从第二行开始合并,只保留首个表头