Python 处理Excel 终止日期减去起始日期的天数,Python交流,编程语言专区,鱼C论坛

冰菲发表于 2025-9-4 13:36:36

Python 处理Excel 终止日期减去起始日期的天数

2025-09-07 2026-09-06
2025-09-07 2026-09-06
2025-09-07 2026-09-06
2025-09-07 2026-09-06
2025-09-07 2026-09-06
2025-09-07 2026-09-06
2025-09-07 2026-09-06

这种格式，如何计算天数？

FishC 发表于 2025-9-4 13:36:58

要计算Excel中终止日期减去起始日期的天数，可以使用Python的 pandas 库和 datetime 模块。以下是完整的解决方案：

import pandas as pd
from datetime import datetime

# 读取Excel文件（假设数据在Sheet1中，且没有表头）
df = pd.read_excel('your_file.xlsx', sheet_name='Sheet1', header=None)

# 将两列转换为日期格式
df = pd.to_datetime(df)# 起始日期列（第一列）
df = pd.to_datetime(df)# 终止日期列（第二列）

# 计算天数差（终止日期 - 起始日期）
df = (df - df).dt.days# 结果保存在第三列

# 保存结果到新Excel文件
df.to_excel('result.xlsx', index=False, header=False)

关键说明：
1. 使用 pd.to_datetime() 确保日期被正确解析
2. 日期相减得到 Timedelta 对象
3. 通过 .dt.days 提取天数数值
4. 结果会保存在第三列中

如果你的Excel文件有表头，需要修改 header 参数，并使用列名而不是数字索引。

注意：请先安装所需库：

pip install pandas openpyxl

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

冰菲发表于 2025-9-4 13:42:50

运行不了报错AttributeError: 'DatetimeProperties' object has no attribute 'days'. Did you mean: 'day'?
删除，这个代码就正常运行
df = pd.to_datetime(df)# 起始日期列（第一列）
df = pd.to_datetime(df)# 终止日期列（第二列）

df = (df - df).dt.days# 结果保存在第三列

FishC 发表于 2025-9-4 13:43:37

冰菲发表于 2025-09-04 13:42
运行不了报错AttributeError: 'DatetimeProperties' ...

您的代码报错是因为在处理日期列时方式不正确。`pd.to_datetime()` 应用于整个 DataFrame 时，返回的是日期格式的 DataFrame，但减法操作 `df - df` 会导致自己减自己（总是为0），且 `.dt.days` 不能直接用于整个 DataFrame。正确的方法是分别处理两列日期。

以下是修正后的代码，用于计算终止日期减去起始日期的天数：

import pandas as pd

# 读取Excel文件（假设没有表头，且数据在默认的Sheet1中）
df = pd.read_excel('your_file.xlsx', header=None)

# 将第一列（起始日期）和第二列（终止日期）转换为日期类型
start_dates = pd.to_datetime(df)
end_dates = pd.to_datetime(df)

# 计算天数差：终止日期 - 起始日期
days_diff = (end_dates - start_dates).dt.days

# 将天数差添加到DataFrame的新列（例如第三列）
df = days_diff

# 保存结果到新Excel文件（包含原数据和天数差）
df.to_excel('result.xlsx', index=False, header=False)

关键点：
- 使用 pd.to_datetime(df) 和 pd.to_datetime(df) 分别处理两列日期。
- 日期相减后得到 Timedelta 对象，使用 .dt.days 提取天数。
- 结果会保存在第三列，您可以根据需要调整输出。

如果只想保存天数差（而不保留原日期列），可以修改为：

# 只保存天数差到新文件
days_diff.to_frame().to_excel('result_days_only.xlsx', index=False, header=False)

注意：请将 'your_file.xlsx' 替换为您的实际文件名。确保已安装 pandas 和 openpyxl 库：

pip install pandas openpyxl

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

冰菲发表于 2025-9-4 13:59:07

可能日期格式特殊吧，你这个代码运行不了

FishC 发表于 2025-9-4 13:59:33

冰菲发表于 2025-09-04 13:59
可能日期格式特殊吧，你这个代码运行不了

您的观察是正确的，我之前的代码确实有问题。对于特殊日期格式，我们需要更精确的处理方式。以下是修正后的代码，可以正确处理Excel中的日期计算：

import pandas as pd

# 读取Excel文件
df = pd.read_excel('your_file.xlsx', header=None)

# 分别处理两列日期
start_dates = pd.to_datetime(df.iloc[:, 0])# 第一列作为起始日期
end_dates = pd.to_datetime(df.iloc[:, 1]) # 第二列作为终止日期

# 计算天数差
days_diff = (end_dates - start_dates).dt.days

# 将结果添加到原DataFrame
df = days_diff

# 保存结果
df.to_excel('result.xlsx', index=False, header=False)

如果您的日期格式比较特殊，可能需要指定日期格式：

# 如果日期格式是"YYYY-MM-DD"
start_dates = pd.to_datetime(df.iloc[:, 0], format='%Y-%m-%d')
end_dates = pd.to_datetime(df.iloc[:, 1], format='%Y-%m-%d')

如果仍然有问题，可以先检查一下Excel中的日期是如何存储的：

print(df.head())# 查看前几行数据
print(df.dtypes)# 查看数据类型

如果Excel中的日期是字符串格式，可能需要先清理数据：

# 去除可能的空格
df.iloc[:, 0] = df.iloc[:, 0].str.strip()
df.iloc[:, 1] = df.iloc[:, 1].str.strip()

如果日期是Excel的序列号格式（数字），可以使用：

from datetime import datetime, timedelta
excel_origin = datetime(1899, 12, 30)# Excel的起始日期

# 转换Excel序列号为日期
start_dates = ]
end_dates = ]

请根据您的实际情况选择合适的方法。如果仍有问题，可以提供更多关于日期格式的信息。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

冰菲发表于 2025-9-4 14:27:57

2025/9/7 0:00:00

起始日期和终止日期运行完都变成后缀到时间格式了

FishC 发表于 2025-9-4 14:28:39

冰菲发表于 2025-09-04 14:27
2025/9/7 0:00:00

起始日期和终止日期运行完都变 ...

您遇到的问题是Excel中的日期时间格式包含了时间部分（0:00:00），这导致了处理上的复杂性。以下是修正后的代码，专门处理这种包含时间的日期格式：

import pandas as pd

# 读取Excel文件
df = pd.read_excel('your_file.xlsx', header=None)

# 处理日期时间格式
# 将两列转换为日期时间格式，并提取日期部分
start_dates = pd.to_datetime(df.iloc[:, 0]).dt.date
end_dates = pd.to_datetime(df.iloc[:, 1]).dt.date

# 计算天数差（只计算日期部分）
days_diff = (end_dates - start_dates).dt.days

# 将结果添加到原DataFrame
df = days_diff

# 保存结果
df.to_excel('result.xlsx', index=False, header=False)

如果您只想保留天数结果而不保留原始日期列：

# 只保存天数结果
result_df = pd.DataFrame(days_diff)
result_df.to_excel('result_days_only.xlsx', index=False, header=False)

如果您想查看处理后的日期格式，可以添加打印语句：

print("处理后的起始日期:")
print(start_dates.head())
print("\n处理后的终止日期:")
print(end_dates.head())
print("\n天数差:")
print(days_diff.head())

如果您的日期格式确实特殊（如"2025/9/7 0:00:00"），可能需要指定确切的格式：

# 指定日期时间格式
date_format = "%Y/%m/%d %H:%M:%S"
start_dates = pd.to_datetime(df.iloc[:, 0], format=date_format).dt.date
end_dates = pd.to_datetime(df.iloc[:, 1], format=date_format).dt.date

关键点：
- 使用 .dt.date 提取日期部分，忽略时间部分
- 确保使用正确的列索引（0和1分别表示第一列和第二列）
- 如果日期格式特殊，使用 format 参数明确指定

如果仍有问题，请尝试先查看原始数据的格式：

print(df.head())
print(df.dtypes)

这将帮助确定Excel中日期数据的实际存储方式。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

冰菲发表于 2025-9-4 16:12:27

太啰嗦了

FishC 发表于 2025-9-4 16:12:46

冰菲发表于 2025-09-04 16:12
太啰嗦了

使用pandas处理Excel日期计算天数差的简洁代码：

import pandas as pd

# 读取Excel文件
df = pd.read_excel('your_file.xlsx', header=None)

# 计算天数差
df = (pd.to_datetime(df.iloc) - pd.to_datetime(df.iloc)).dt.days

# 保存结果
df.to_excel('result.xlsx', index=False, header=False)

如果日期格式特殊，添加format参数：

df = (pd.to_datetime(df.iloc, format='%Y/%m/%d %H:%M:%S') -
pd.to_datetime(df.iloc, format='%Y/%m/%d %H:%M:%S')).dt.days

这样就简洁多了。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

冰菲发表于 2025-9-4 16:34:37

不对

FishC 发表于 2025-9-4 16:35:03

冰菲发表于 2025-09-04 16:34
不对

简洁的解决方案：

import pandas as pd

df = pd.read_excel('your_file.xlsx', header=None)
df = (pd.to_datetime(df.iloc[:, 1]) - pd.to_datetime(df.iloc[:, 0])).dt.days
df.to_excel('result.xlsx', index=False, header=False)

如果日期格式特殊，添加format参数：
df = (pd.to_datetime(df.iloc[:, 1], format='%Y/%m/%d %H:%M:%S') -
pd.to_datetime(df.iloc[:, 0], format='%Y/%m/%d %H:%M:%S')).dt.days

这样就简洁明了了。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

gaming1990 发表于 2025-9-12 14:36:57

在WPS中直接用=B1-A1可以猜到同格式的计算很方便，用python?
from openpyxl import load_workbook

file = '1.xlsx'
# 读取工作薄
wb = load_workbook(file)
#　指定工作表
ws = wb['Sheet1']

# 输入数据　也可用其它的输入方式
ws['A4'].value = '2025-09-07'
ws['B4'].value = '2026-09-06'

# 输入公式让excel自动计算
ws['C4'].value = '=B4-A4'

# 保存工作薄
wb.save(file)

这个应该有所帮助吧

soonkuayue 发表于 2025-9-15 08:10:07

转时间戳相减再转会天数?

凊风发表于 2025-9-24 09:56:37

FishC 发表于 2025-9-4 13:36
要计算Excel中终止日期减去起始日期的天数，可以使用Python的 pandas 库和 datetime 模块。以下是完整的解 ...

请问可以用VB宏来实现吗？

FishC 发表于 2025-9-24 09:57:40

凊风发表于 2025-09-24 09:56
FishC 发表于 2025-9-4 13:36
要计算Excel中终止日期 ...

当然可以使用VBA宏来实现Excel中终止日期减去起始日期的天数计算。以下是详细的VBA宏代码和说明：

Sub CalculateDays()
Dim ws As Worksheet
Set ws = ActiveSheet ' 假设数据在当前活动工作表

Dim lastRow As Long
lastRow = ws.Cells(ws.Rows.Count, "A").End(xlUp).Row ' 获取A列最后一行

Dim i As Long
For i = 1 To lastRow
   Dim startDate As Date
   Dim endDate As Date

   ' 检查单元格是否为有效日期
   If IsDate(ws.Cells(i, 1).Value) And IsDate(ws.Cells(i, 2).Value) Then
         startDate = CDate(ws.Cells(i, 1).Value) ' 转换起始日期
         endDate = CDate(ws.Cells(i, 2).Value) ' 转换终止日期
         ws.Cells(i, 3).Value = endDate - startDate ' 计算天数差并输出到C列
   Else
         ws.Cells(i, 3).Value = "无效日期" ' 如果日期无效则显示错误
   End If
Next i
End Sub

使用方法：
1. 按 Alt + F11 打开VBA编辑器。
2. 插入新模块（菜单：插入 -> 模块）。
3. 粘贴上述代码。
4. 按 F5 运行宏。

代码说明：
- 宏会遍历A列和B列的每一行数据。
- 使用 IsDate 函数检查日期是否有效。
- 使用 CDate 函数将单元格值转换为日期类型。
- 日期相减直接得到天数差（VBA中日期相减返回数值，表示天数）。
- 结果会自动填入C列对应行。

注意事项：
- 如果Excel中的日期是文本格式，此代码会自动转换。
- 如果日期无效（如空单元格或非日期文本），C列会显示"无效日期"。
- 运行前请确保Excel已启用宏（文件 -> 选项 -> 信任中心 -> 宏设置）。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

页: [1]

鱼C论坛's Archiver

Python 处理Excel 终止日期减去起始日期的天数