鱼C论坛

 找回密码
 立即注册
查看: 1970|回复: 5

[已解决]excel写入

[复制链接]
发表于 2023-7-12 10:06:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
各位大佬,如何遍历一个文件夹里的所有excel文件,将里面的数据写入到另一个文件夹里的同名excel里(另一个文件夹里没有同名excel则新增一个excel)
最佳答案
2023-7-12 11:08:24
你可以使用Python的库 pandas 来读取和写入Excel文件, os 和 glob 来操作文件和文件夹。以下是一种可能的实现方法:

首先,确保你安装了必要的库。如果没有安装,你可以使用以下命令进行安装:

  1. pip install pandas openpyxl
复制代码


以下是一段简单的Python代码实现:

  1. import os
  2. import glob
  3. import pandas as pd

  4. src_folder = '/path/to/source/folder' # 这是源文件夹的路径
  5. dst_folder = '/path/to/destination/folder' # 这是目标文件夹的路径

  6. # 遍历源文件夹中的所有Excel文件
  7. for src_file in glob.glob(os.path.join(src_folder, '*.xlsx')):

  8.     # 获取文件的基本名(无路径和扩展名)
  9.     base_name = os.path.basename(src_file)
  10.     file_name = os.path.splitext(base_name)[0]

  11.     # 创建目标文件路径
  12.     dst_file = os.path.join(dst_folder, file_name + '.xlsx')

  13.     # 读取源文件中的数据
  14.     df = pd.read_excel(src_file)

  15.     # 如果目标文件已存在,读取其内容并附加新的数据;
  16.     # 否则,直接将数据写入新文件。
  17.     if os.path.exists(dst_file):
  18.         df_existing = pd.read_excel(dst_file)
  19.         df_combined = pd.concat([df_existing, df], ignore_index=True)
  20.         df_combined.to_excel(dst_file, index=False)
  21.     else:
  22.         df.to_excel(dst_file, index=False)
复制代码


这段代码会遍历源文件夹中的所有.xlsx文件,对每个文件,它都会读取数据,检查目标文件夹中是否已存在具有相同名称的文件,如果存在,则将新的数据附加到现有数据中,否则,将创建一个新的文件并写入数据。

这段代码假设源文件和目标文件都是.xlsx格式,且所有源文件都可以直接以DataFrame的形式读取。如果实际情况不同,可能需要对代码进行适当修改。
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2023-7-12 10:06:26 | 显示全部楼层
你可以使用 os.listdir() 遍历文件夹中的所有文件,然后通过判断文件名是否为 Excel 文件来筛选出需要处理的文件。然后,你可以使用 pandas 库来读取和写入 Excel 文件。

以下是实现该功能的示例代码:
  1. import os
  2. import pandas as pd
  3. # 源文件夹和目标文件夹路径
  4. source_folder = '源文件夹路径'
  5. target_folder = '目标文件夹路径'
  6. # 遍历源文件夹中的文件
  7. for filename in os.listdir(source_folder):
  8.     # 判断文件是否为Excel文件
  9.     if filename.endswith('.xlsx') or filename.endswith('.xls'):
  10.         # 构建源文件路径和目标文件路径
  11.         source_path = os.path.join(source_folder, filename)
  12.         target_path = os.path.join(target_folder, filename)
  13.         
  14.         # 判断目标文件是否已存在
  15.         if os.path.exists(target_path):
  16.             # 读取目标文件中的数据
  17.             target_data = pd.read_excel(target_path)
  18.             
  19.             # 读取源文件中的数据
  20.             source_data = pd.read_excel(source_path)
  21.             
  22.             # 将源文件中的数据追加到目标文件中
  23.             target_data = target_data.append(source_data, ignore_index=True)
  24.             
  25.             # 将合并后的数据写入目标文件
  26.             target_data.to_excel(target_path, index=False)
  27.         else:
  28.             # 如果目标文件不存在,直接将源文件复制到目标文件夹
  29.             os.rename(source_path, target_path)
复制代码

请将代码中的 '源文件夹路径''目标文件夹路径' 替换为你实际的文件夹路径,然后运行代码即可实现将源文件夹中的 Excel 文件数据写入到目标文件夹中的同名 Excel 文件,如果目标文件夹中没有同名文件,则会创建一个新的 Excel 文件。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-7-12 11:08:24 | 显示全部楼层    本楼为最佳答案   
你可以使用Python的库 pandas 来读取和写入Excel文件, os 和 glob 来操作文件和文件夹。以下是一种可能的实现方法:

首先,确保你安装了必要的库。如果没有安装,你可以使用以下命令进行安装:

  1. pip install pandas openpyxl
复制代码


以下是一段简单的Python代码实现:

  1. import os
  2. import glob
  3. import pandas as pd

  4. src_folder = '/path/to/source/folder' # 这是源文件夹的路径
  5. dst_folder = '/path/to/destination/folder' # 这是目标文件夹的路径

  6. # 遍历源文件夹中的所有Excel文件
  7. for src_file in glob.glob(os.path.join(src_folder, '*.xlsx')):

  8.     # 获取文件的基本名(无路径和扩展名)
  9.     base_name = os.path.basename(src_file)
  10.     file_name = os.path.splitext(base_name)[0]

  11.     # 创建目标文件路径
  12.     dst_file = os.path.join(dst_folder, file_name + '.xlsx')

  13.     # 读取源文件中的数据
  14.     df = pd.read_excel(src_file)

  15.     # 如果目标文件已存在,读取其内容并附加新的数据;
  16.     # 否则,直接将数据写入新文件。
  17.     if os.path.exists(dst_file):
  18.         df_existing = pd.read_excel(dst_file)
  19.         df_combined = pd.concat([df_existing, df], ignore_index=True)
  20.         df_combined.to_excel(dst_file, index=False)
  21.     else:
  22.         df.to_excel(dst_file, index=False)
复制代码


这段代码会遍历源文件夹中的所有.xlsx文件,对每个文件,它都会读取数据,检查目标文件夹中是否已存在具有相同名称的文件,如果存在,则将新的数据附加到现有数据中,否则,将创建一个新的文件并写入数据。

这段代码假设源文件和目标文件都是.xlsx格式,且所有源文件都可以直接以DataFrame的形式读取。如果实际情况不同,可能需要对代码进行适当修改。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 1 反对 0

使用道具 举报

 楼主| 发表于 2023-7-12 13:55:11 | 显示全部楼层
isdkz 发表于 2023-7-12 11:08
你可以使用Python的库 pandas 来读取和写入Excel文件, os 和 glob 来操作文件和文件夹。以下是一种可能的 ...

    # 否则,直接将数据写入新文件。
    if os.path.exists(dst_file):
        df_existing = pd.read_excel(dst_file)
        df_combined = pd.concat([df_existing, df], ignore_index=True)
        df_combined.to_excel(dst_file, index=False)
那大佬,如果目标文件已存在,要把他覆盖的话,这段应该怎么改
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2023-7-12 13:57:12 | 显示全部楼层
a1503818992 发表于 2023-7-12 13:55
# 否则,直接将数据写入新文件。
    if os.path.exists(dst_file):
        df_existing = pd.rea ...

如果你希望直接覆盖目标文件中的内容,而不是将新数据附加到旧数据上,你只需要在读取源文件后直接写入目标文件,无需检查目标文件是否存在。这样就会覆盖任何已存在的文件。

以下是相应部分的代码:

  1. # 读取源文件中的数据
  2. df = pd.read_excel(src_file)

  3. # 将数据写入目标文件(覆盖已存在的文件)
  4. df.to_excel(dst_file, index=False)
复制代码


现在,无论目标文件是否已存在,都会被新数据覆盖。如果它不存在, to_excel 函数将创建一个新文件。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2023-7-18 14:51:22 | 显示全部楼层
isdkz 发表于 2023-7-12 13:57
如果你希望直接覆盖目标文件中的内容,而不是将新数据附加到旧数据上,你只需要在读取源文件后直接写入目 ...

好的,谢谢大佬!
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-22 05:38

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表