王大可2000 发表于 2023-8-30 16:23:40

提取数据

已知Starting year.xlsx中c列为开始时间,内容格式为1959-1-0,利用Python遍历Starting year.xlsx去掉开始年份 1970 年以后的站点。
import pandas as pd

# 读取Starting year.xlsx文件
df = pd.read_excel('Starting year.xlsx')

# 将c列转换为日期格式
df['c'] = pd.to_datetime(df['c'], format='%Y-%m-%d', errors='coerce')

# 过滤出开始时间在1970年以前的站点
df_filtered = df.dt.year > 1970]

# 将结果保存到新的Excel文件中
df_filtered.to_excel('Starting year_filtered.xlsx', index=False)
运行结束后为何表中无内容,已检查原文件无缺值,读取输出路径无误。该如何修改?

isdkz 发表于 2023-8-30 16:24:05

在代码中,你使用了 df.dt.year > 1970] 来过滤出开始时间在1970年以前的站点。然而,由于你的开始时间是以年为单位进行过滤的,所以这个条件会导致所有的站点都被过滤掉,因为 1970年 被视为 1970年以后 。

要解决这个问题,你可以将条件修改为 df['c'].dt.year < 1970 ,这样就可以过滤出开始时间在1970年以前的站点。

以下是修改后的代码:

import pandas as pd

# 读取Starting year.xlsx文件
df = pd.read_excel('Starting year.xlsx')

# 将c列转换为日期格式
df['c'] = pd.to_datetime(df['c'], format='%Y-%m-%d', errors='coerce')

# 过滤出开始时间在1970年以前的站点
df_filtered = df.dt.year < 1970]

# 将结果保存到新的Excel文件中
df_filtered.to_excel('Starting year_filtered.xlsx', index=False)


运行修改后的代码后,你将会得到开始时间在1970年以前的站点,并将结果保存到 Starting year_filtered.xlsx 文件中。

王大可2000 发表于 2023-8-30 16:34:46

isdkz 发表于 2023-8-30 16:24
在代码中,你使用了 df.dt.year > 1970] 来过滤出开始时间在1970年以前的站点。然而,由于你的开始 ...

为何表内依旧无内容

ba21 发表于 2023-8-30 20:14:59

你应该把相应的附件上传。
有些问题看代码不一定看得到问题,还需要根据实际情况调试。
页: [1]
查看完整版本: 提取数据