数据处理 - 新手乐园
为了实现将省站点.xlsx中的站名和区站号以及output文件夹中的每个Excel文件中的时间导入新的Excel文件 Starting year.xlsx,并在Starting year.xlsx中插入表头站名、区站号、开始时间,可以按照以下步骤进行操作:
1. 打开省站点.xlsx文件和输出output文件夹。
2. 读取省站点.xlsx文件中的站名和区站号。你可以使用Python中的pandas库进行读取和处理。示例代码如下:import pandas as pd# 读取省站点.xlsx文件df_station = pd.read_excel('省站点.xlsx')# 提取站名和区站号df_station = df_station[['B', 'A']]df_station.columns = ['站名', '区站号']
3. 创建一个新的DataFrame来存储结果数据。在该DataFrame中,插入表头'站名'、'区站号'、'开始时间'。示例代码如下:df_result = pd.DataFrame(columns=['站名', '区站号', '开始时间'])
4. 遍历output文件夹中的所有Excel文件,并读取它们的时间数据。示例代码如下:import os# 获取output文件夹中的所有Excel文件路径folder_path = 'output/'excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]# 遍历每个Excel文件,读取时间数据并添加到结果DataFrame中for file in excel_files: file_path = os.path.join(folder_path, file) df_excel = pd.read_excel(file_path) # 提取时间数据 start_year = df_excel.loc[0, 'Year'] start_mon = df_excel.loc[0, 'Mon'] start_day = df_excel.loc[0, 'Day'] # 将时间数据格式化为字符串,如'1959-1-0' start_time = f'{start_year}-{start_mon}-{start_day}' # 将站名、区站号和开始时间添加到结果DataFrame中 df_result = df_result.append({'站名': df_station.loc[0, '站名'], '区站号': df_station.loc[0, '区站号'], '开始时间': start_time}, ignore_index=True)
5. 将结果DataFrame写入Starting year.xlsx文件中的一个工作表。示例代码如下:# 写入结果DataFrame到Starting year.xlsx文件中的一个工作表output_file_path = 'Starting year.xlsx'with pd.ExcelWriter(output_file_path) as writer: df_result.to_excel(writer, index=False, sheet_name='Result')
完成以上步骤后,Starting year.xlsx文件中的工作表'Result'将包含所需的数据,表头为'站名'、'区站号'和'开始时间'。
希望以上步骤对你有帮助!如果你还有其他问题,请随时提问。
球一个最佳答案谢谢啦!这对我非常重要!
|