|
发表于 2023-5-16 17:49:14
|
显示全部楼层
1. 使用 pandas 的 read_excel 方法读取 Excel 文件,再使用 to_excel 方法将文件转换为 Excel2007 及以后版本的文件格式,并设置数字格式为保留一位小数。
- import pandas as pd
- # 读取 Excel 文件
- df = pd.read_excel('文件名.xls', sheet_name='Sheet1')
- # 转换文件格式并设置数字格式
- df.to_excel('文件名.xlsx', sheet_name='Sheet1', index=False, float_format='%.1f')
复制代码
2. 使用 pandas 的 to_datetime 方法将年月日列转换为时间格式,并添加 time 列,再使用 drop 方法删除年月日列。
- # 转换时间格式并添加 time 列
- df['time'] = pd.to_datetime(df['年月日列'], format='%Y-%m-%d')
- # 删除年月日列
- df = df.drop(columns=['年月日列'])
复制代码
3. 使用 pandas 的 groupby 方法对 A 列和 B 列进行分组,并使用 sum 方法求和,再将结果存储到 Sheet2 中。
- # 分组求和并存储到 Sheet2
- df.groupby([df['A列'], df['B列']])['D列'].sum().reset_index(name='月尺度').to_excel('文件名.xlsx', sheet_name='Sheet2', index=False)
复制代码
4. 使用 pandas 的 DataFrame 方法创建一个新的 DataFrame,再使用 insert 方法插入表头和具体指标数据,最后使用 to_excel 方法将结果存储到新 Excel 文件中。
- # 创建新的 DataFrame
- new_df = pd.DataFrame(columns=['月降水均值', '月降水中值', '月降水极大值', '月降水极小值'])
- # 插入表头和具体指标数据
- new_df.insert(0, '月降水均值', [1, 2, 3, 4])
- new_df.insert(1, '月降水中值', [5, 6, 7, 8])
- new_df.insert(2, '月降水极大值', [9, 10, 11, 12])
- new_df.insert(3, '月降水极小值', [13, 14, 15, 16])
- # 存储为新 Excel 文件
- new_df.to_excel('N文件名.xlsx', sheet_name='Sheet1', index=False)
复制代码 |
|