提取数据
已知Starting year.xlsx中c列为开始时间,内容格式为1959-1-0,利用Python遍历Starting year.xlsx去掉开始年份 1970 年以后的站点。import pandas as pd
# 读取Starting year.xlsx文件
df = pd.read_excel('Starting year.xlsx')
# 将c列转换为日期格式
df['c'] = pd.to_datetime(df['c'], format='%Y-%m-%d', errors='coerce')
# 过滤出开始时间在1970年以前的站点
df_filtered = df.dt.year > 1970]
# 将结果保存到新的Excel文件中
df_filtered.to_excel('Starting year_filtered.xlsx', index=False)
运行结束后为何表中无内容,已检查原文件无缺值,读取输出路径无误。该如何修改? 在代码中,你使用了 df.dt.year > 1970] 来过滤出开始时间在1970年以前的站点。然而,由于你的开始时间是以年为单位进行过滤的,所以这个条件会导致所有的站点都被过滤掉,因为 1970年 被视为 1970年以后 。
要解决这个问题,你可以将条件修改为 df['c'].dt.year < 1970 ,这样就可以过滤出开始时间在1970年以前的站点。
以下是修改后的代码:
import pandas as pd
# 读取Starting year.xlsx文件
df = pd.read_excel('Starting year.xlsx')
# 将c列转换为日期格式
df['c'] = pd.to_datetime(df['c'], format='%Y-%m-%d', errors='coerce')
# 过滤出开始时间在1970年以前的站点
df_filtered = df.dt.year < 1970]
# 将结果保存到新的Excel文件中
df_filtered.to_excel('Starting year_filtered.xlsx', index=False)
运行修改后的代码后,你将会得到开始时间在1970年以前的站点,并将结果保存到 Starting year_filtered.xlsx 文件中。 isdkz 发表于 2023-8-30 16:24
在代码中,你使用了 df.dt.year > 1970] 来过滤出开始时间在1970年以前的站点。然而,由于你的开始 ...
为何表内依旧无内容
你应该把相应的附件上传。
有些问题看代码不一定看得到问题,还需要根据实际情况调试。
页:
[1]