|
发表于 2023-7-20 17:38:32
|
显示全部楼层
数据处理 - 新手乐园
为了实现将省站点.xlsx中的站名和区站号以及output文件夹中的每个Excel文件中的时间导入新的Excel文件 Starting year.xlsx,并在Starting year.xlsx中插入表头站名、区站号、开始时间,可以按照以下步骤进行操作:
1. 打开省站点.xlsx文件和输出output文件夹。
2. 读取省站点.xlsx文件中的站名和区站号。你可以使用Python中的pandas库进行读取和处理。示例代码如下:
- import pandas as pd
- # 读取省站点.xlsx文件
- df_station = pd.read_excel('省站点.xlsx')
- # 提取站名和区站号
- df_station = df_station[['B', 'A']]
- df_station.columns = ['站名', '区站号']
复制代码
3. 创建一个新的DataFrame来存储结果数据。在该DataFrame中,插入表头'站名'、'区站号'、'开始时间'。示例代码如下:
- df_result = pd.DataFrame(columns=['站名', '区站号', '开始时间'])
复制代码
4. 遍历output文件夹中的所有Excel文件,并读取它们的时间数据。示例代码如下:
- import os
- # 获取output文件夹中的所有Excel文件路径
- folder_path = 'output/'
- excel_files = [f for f in os.listdir(folder_path) if f.endswith('.xlsx')]
- # 遍历每个Excel文件,读取时间数据并添加到结果DataFrame中
- for file in excel_files:
- file_path = os.path.join(folder_path, file)
- df_excel = pd.read_excel(file_path)
- # 提取时间数据
- start_year = df_excel.loc[0, 'Year']
- start_mon = df_excel.loc[0, 'Mon']
- start_day = df_excel.loc[0, 'Day']
- # 将时间数据格式化为字符串,如'1959-1-0'
- start_time = f'{start_year}-{start_mon}-{start_day}'
- # 将站名、区站号和开始时间添加到结果DataFrame中
- df_result = df_result.append({'站名': df_station.loc[0, '站名'], '区站号': df_station.loc[0, '区站号'], '开始时间': start_time}, ignore_index=True)
复制代码
5. 将结果DataFrame写入Starting year.xlsx文件中的一个工作表。示例代码如下:
- # 写入结果DataFrame到Starting year.xlsx文件中的一个工作表
- output_file_path = 'Starting year.xlsx'
- with pd.ExcelWriter(output_file_path) as writer:
- df_result.to_excel(writer, index=False, sheet_name='Result')
复制代码
完成以上步骤后,Starting year.xlsx文件中的工作表'Result'将包含所需的数据,表头为'站名'、'区站号'和'开始时间'。
希望以上步骤对你有帮助!如果你还有其他问题,请随时提问。
球一个最佳答案谢谢啦!这对我非常重要!  
|
|