Python 批量处理Excel，终止日期-起始日期=天数？,Python交流,编程语言专区,鱼C论坛

冰菲发表于 2025-9-4 13:09:19

Python 批量处理Excel，终止日期-起始日期=天数？

比如2026-9-4减去2025-9-4等于365天
如何用代码实现？

FishC 发表于 2025-9-4 13:10:24

解答：

要在Python中批量处理Excel文件并计算两个日期之间的天数差（例如2026-9-4减去2025-9-4），您可以使用pandas库来简化操作。以下是实现方法：

首先，确保安装了必要的库。如果未安装，请运行：
pip install pandas openpyxl

然后，使用以下代码示例。假设您的Excel文件中有“起始日期”和“终止日期”列（请根据实际列名调整）：

import pandas as pd

# 读取Excel文件
df = pd.read_excel('your_file.xlsx')

# 转换日期列为datetime类型
df['起始日期'] = pd.to_datetime(df['起始日期'])
df['终止日期'] = pd.to_datetime(df['终止日期'])

# 计算天数差：终止日期 - 起始日期
df['天数差'] = (df['终止日期'] - df['起始日期']).dt.days

# 保存结果到新Excel文件
df.to_excel('output.xlsx', index=False)

代码解释：
- 使用 pd.read_excel 读取Excel文件。
- 使用 pd.to_datetime 将日期字符串转换为datetime对象，便于计算。
- 计算差值并使用 .dt.days 提取天数。
- 使用 to_excel 保存结果，index=False 避免输出行索引。

对于批量处理多个Excel文件，可以使用循环遍历文件夹中的所有文件：

import os
import pandas as pd

# 设置输入和输出文件夹路径
input_folder = 'path/to/input/files'
output_folder = 'path/to/output/files'

# 遍历文件夹中的所有Excel文件
for file_name in os.listdir(input_folder):
if file_name.endswith('.xlsx') or file_name.endswith('.xls'):
   file_path = os.path.join(input_folder, file_name)
   df = pd.read_excel(file_path)

   # 处理日期列（假设列名为“起始日期”和“终止日期”）
   df['起始日期'] = pd.to_datetime(df['起始日期'])
   df['终止日期'] = pd.to_datetime(df['终止日期'])
   df['天数差'] = (df['终止日期'] - df['起始日期']).dt.days

   # 保存处理后的文件
   output_path = os.path.join(output_folder, 'processed_' + file_name)
   df.to_excel(output_path, index=False)

注意事项：
- 确保Excel文件中的日期列格式正确，否则 pd.to_datetime 可能无法解析。如果日期格式特殊，可以指定格式参数，例如 pd.to_datetime(df['列名'], format='%Y-%m-%d')。
- 如果列名不同，请替换代码中的“起始日期”和“终止日期”为实际列名。
- 批量处理时，输出文件会添加“processed_”前缀，以避免覆盖原文件。

这个方法是高效且易于理解的，适合处理大量数据。如果有更多细节需求，请提供具体文件结构以便进一步调整。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

冰菲发表于 2025-9-4 13:19:06

AttributeError: 'DatetimeProperties' object has no attribute 'days'. Did you mean: 'day'?

报错了

FishC 发表于 2025-9-4 13:19:46

冰菲发表于 2025-09-04 13:19
AttributeError: 'DatetimeProperties' object has no ...

您遇到的错误是因为代码中存在错误。让我提供一个修正后的解决方案：

错误原因分析：
1. 对同一列进行了两次转换，而且没有指定列名
2. 尝试从DatetimeProperties对象获取days属性，这是不正确的

以下是修正后的代码：

import pandas as pd

# 读取Excel文件
df = pd.read_excel('your_file.xlsx')

# 确保列名正确（根据实际情况修改）
start_col = '起始日期'# 替换为实际的起始日期列名
end_col = '终止日期' # 替换为实际的终止日期列名

# 转换日期列为datetime类型
df = pd.to_datetime(df)
df = pd.to_datetime(df)

# 计算天数差：终止日期 - 起始日期
df['天数差'] = (df - df).dt.days

# 保存结果到新Excel文件
df.to_excel('output.xlsx', index=False)

对于批量处理多个文件：

import os
import pandas as pd

# 设置输入和输出文件夹路径
input_folder = 'path/to/input/files'
output_folder = 'path/to/output/files'

# 确保输出文件夹存在
os.makedirs(output_folder, exist_ok=True)

# 列名设置（根据实际情况修改）
start_col = '起始日期'
end_col = '终止日期'

# 遍历文件夹中的所有Excel文件
for file_name in os.listdir(input_folder):
if file_name.endswith(('.xlsx', '.xls')):
   file_path = os.path.join(input_folder, file_name)
   df = pd.read_excel(file_path)

   # 处理日期列
   df = pd.to_datetime(df)
   df = pd.to_datetime(df)

   # 计算天数差
   df['天数差'] = (df - df).dt.days

   # 保存处理后的文件
   output_path = os.path.join(output_folder, 'processed_' + file_name)
   df.to_excel(output_path, index=False)

关键修正点：
1. 明确指定要转换的列名
2. 使用 .dt.days 从时间差对象中提取天数
3. 将结果保存为新列而不是覆盖原数据

如果您的Excel文件中的列名不同，请将代码中的 '起始日期' 和 '终止日期' 替换为实际的列名。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

页: [1]

鱼C论坛's Archiver

Python 批量处理Excel，终止日期-起始日期=天数？