|
发表于 2023-6-2 17:53:32
|
显示全部楼层
可以在读取原表数据时,将第一行作为表头(header)保存下来,然后在生成新表格时添加回去。
修改代码如下:
- import os
- import pandas as pd
- # 原始表格文件夹路径
- input_folder = r'G:\2023\777'
- # 保存新表格的文件夹路径
- output_folder = r'G:\2023\555'
- # 获取原始表格文件列表
- input_files = os.listdir(input_folder)
- for file in input_files:
- if file.endswith('.xls'):
- # 构建原始表格文件的完整路径
- file_path = os.path.join(input_folder, file)
-
- # 读取原始表格数据,跳过第一行,并将第一行作为表头(header)保存下来
- df = pd.read_excel(file_path, skiprows=1, header=0)
- header = pd.read_excel(file_path, nrows=0).columns.tolist()
-
- # 筛选出xx社区
- filtered_df = df[df.iloc[:, 6] == 'xx社区']
-
- # 重新排列序号列
- filtered_df.loc[:, '序号'] = range(1, len(filtered_df) + 1)
-
- # 保留指定列
- columns_to_keep = ['序号', '户主姓名', 'xx社区','金额合计']
- filtered_df = filtered_df[columns_to_keep]
-
- # 创建新表格的文件名
- output_file = os.path.join(output_folder, os.path.splitext(file)[0] + '.xlsx')
-
- # 保存新表格,添加表头(header)到新表格首行
- with pd.ExcelWriter(output_file) as writer:
- filtered_df.to_excel(writer, sheet_name='Sheet1', index=False, startrow=1)
- workbook = writer.book
- worksheet = writer.sheets['Sheet1']
- for idx, val in enumerate(header):
- worksheet.write(0, idx, val)
复制代码
|
|