小马爱乐容 发表于 2024-1-5 22:47:18

将excel文件的名称作为一列填充到excel表中



如图,将excel文件名称填充为excel表的新的一列。

如果文件内中有很多excel文件都需要进行上述操作,要怎么实现循环呢?

FishC 发表于 2024-1-5 22:47:19

要将excel文件的名称作为一列填充到excel表中,可以使用Python的pandas库来处理。下面是一个示例代码:

import os
import pandas as pd

# 获取指定文件夹下的所有excel文件名
def get_excel_filenames(folder_path):
    excel_files = []
    for filename in os.listdir(folder_path):
      if filename.endswith(".xlsx") or filename.endswith(".xls"):
            excel_files.append(filename)
    return excel_files

# 将excel文件名添加为新的一列
def add_filename_as_column(excel_file):
    df = pd.read_excel(excel_file)# 读取excel文件
    filename = os.path.basename(excel_file)# 获取文件名
    df['文件名'] = filename# 添加新列
    df.to_excel(excel_file, index=False)# 保存修改后的excel文件

# 主函数
def main():
    folder_path = "路径/到/文件夹"# 替换为你的文件夹路径
    excel_files = get_excel_filenames(folder_path)
    for excel_file in excel_files:
      add_filename_as_column(os.path.join(folder_path, excel_file))
    print("文件名添加完成!")

if __name__ == "__main__":
    main()

以上代码中,首先定义了一个`get_excel_filenames`函数,用于获取指定文件夹下的所有excel文件名。然后定义了一个`add_filename_as_column`函数,它接受一个excel文件的路径作为参数,读取该excel文件并添加一个名为"文件名"的新列,值为该文件的文件名。最后,通过循环调用`add_filename_as_column`函数来处理所有的excel文件。

在运行代码之前,要将代码中的`路径/到/文件夹`替换为实际的文件夹路径。

希望这个示例能帮助你解决问题。如果你有任何疑问,请随时提问!

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。

15945179970 发表于 2024-1-6 09:50:35

小马爱乐容 发表于 2024-1-6 11:08:44

import pandas as pd
import os
import re

os.chdir(r'xxx')
file_list = os.listdir('xxx')

# 括号内正则表达式
pattern1 = r'((.*?))'
pattern2 = r'\([^)]*\)'
# 初始化计数
j = 1

for i in file_list:

    # 获取文件名 无xls
    file_name1 = os.path.splitext(os.path.basename(i))
    # 获取文件名 有xls
    file_name2 = file_name1 + '.xls'

    # 读取数据
    firm_info = pd.read_excel(file_name2, skiprows=4, usecols='A:K')
    # 修改数据
    file_name1 = file_name1.replace('股东信息', '')
    file_name1 = re.sub(pattern2, '', file_name1)
    firm_info['序号'] = file_name1

    # 货币种类
    currency = re.search(pattern1, firm_info.columns)
    firm_info['货币种类'] = currency.group(1) if currency else None

    # 修改列名
    firm_info.rename(columns={'序号': '企业名称'}, inplace=True)
    firm_info.rename(columns={firm_info.columns: '认缴'}, inplace=True)
    firm_info.rename(columns={firm_info.columns: '实缴'}, inplace=True)

    # 保存结果,路径中的py1需要修改
    firm_info.to_excel(f'xxx/py{j}.xlsx', index=False)

    # 计数变量 jia 1
    j = j + 1

print('Done!')

小马爱乐容 发表于 2024-1-6 11:09:28

小马爱乐容 发表于 2024-1-6 11:08
import pandas as pd
import os
import re


个人改写的答案
页: [1]
查看完整版本: 将excel文件的名称作为一列填充到excel表中