提取数据,萌新交流区,萌新训练营,鱼C论坛

王大可2000 发表于 2023-8-30 16:23:40

提取数据

已知Starting year.xlsx中c列为开始时间，内容格式为1959-1-0，利用Python遍历Starting year.xlsx去掉开始年份 1970 年以后的站点。
import pandas as pd

# 读取Starting year.xlsx文件
df = pd.read_excel('Starting year.xlsx')

# 将c列转换为日期格式
df['c'] = pd.to_datetime(df['c'], format='%Y-%m-%d', errors='coerce')

# 过滤出开始时间在1970年以前的站点
df_filtered = df.dt.year > 1970]

# 将结果保存到新的Excel文件中
df_filtered.to_excel('Starting year_filtered.xlsx', index=False)
运行结束后为何表中无内容，已检查原文件无缺值，读取输出路径无误。该如何修改？

isdkz 发表于 2023-8-30 16:24:05

在代码中，你使用了 df.dt.year > 1970] 来过滤出开始时间在1970年以前的站点。然而，由于你的开始时间是以年为单位进行过滤的，所以这个条件会导致所有的站点都被过滤掉，因为 1970年被视为 1970年以后。

要解决这个问题，你可以将条件修改为 df['c'].dt.year < 1970 ，这样就可以过滤出开始时间在1970年以前的站点。

以下是修改后的代码：

import pandas as pd

# 读取Starting year.xlsx文件
df = pd.read_excel('Starting year.xlsx')

# 将c列转换为日期格式
df['c'] = pd.to_datetime(df['c'], format='%Y-%m-%d', errors='coerce')

# 过滤出开始时间在1970年以前的站点
df_filtered = df.dt.year < 1970]

# 将结果保存到新的Excel文件中
df_filtered.to_excel('Starting year_filtered.xlsx', index=False)

运行修改后的代码后，你将会得到开始时间在1970年以前的站点，并将结果保存到 Starting year_filtered.xlsx 文件中。

王大可2000 发表于 2023-8-30 16:34:46

isdkz 发表于 2023-8-30 16:24
在代码中，你使用了 df.dt.year > 1970] 来过滤出开始时间在1970年以前的站点。然而，由于你的开始 ...

为何表内依旧无内容

ba21 发表于 2023-8-30 20:14:59

你应该把相应的附件上传。
有些问题看代码不一定看得到问题，还需要根据实际情况调试。

页: [1]

鱼C论坛's Archiver

提取数据