`agg()` 函数在 `pandas` 中是用于对 DataFrame 或 Series 进行聚合操作的一个非常强大的方法。它允许你对数据进行多种统计计算,比如求和、平均值、计数、最大值和最小值等。
### 用法概述
1. **数据分组后聚合**:当与 `groupby()` 一起使用时,可以对每个组应用聚合函数。
2. **多种聚合函数**:可以同时应用多个聚合函数于同一列或不同列。
### 示例代码
我们通过以下简单示例来了解如何使用 `agg()` 函数。
#### 示例 1:基本使用
import pandas as pd
# 创建简单的示例 DataFrame
data = {
'A': ['foo', 'bar', 'foo', 'bar'],
'B': [1, 2, 3, 4],
'C': [5, 6, 7, 8]
}
df = pd.DataFrame(data)
# 应用 agg() 进行聚合
result = df.agg({
'B': ['sum', 'mean'], # 对 B 列求和和平均值
'C': ['max', 'min'] # 对 C 列求最大值和最小值
})
print(result)
**输出**:B C
sum 10 8
mean 2.5 6.5
max NaN 8
min NaN 5
在这个例子中,我们对 `B` 列进行了求和和平均值操作,对 `C` 列进行了最大值和最小值操作。
#### 示例 2:与 `groupby()` 一起使用
如果你想要对某个列进行分组然后计算聚合值,可以这样做:
import pandas as pd
data = {
'A': ['foo', 'bar', 'foo', 'bar'],
'B': [1, 2, 3, 4],
'C': [5, 6, 7, 8]
}
df = pd.DataFrame(data)
# 先按 'A' 列分组,再对其他列应用聚合函数
grouped_result = df.groupby('A').agg({
'B': 'sum', # 对 B 列求和
'C': 'mean' # 对 C 列求平均值
})
print(grouped_result)
**输出**:B C
A
bar 6 7.0
foo 4 6.0
在这个例子中,我们首先按 `A` 列进行分组,然后对 `B` 列进行了求和,对 `C` 列进行了平均值计算。
### 总结
- `agg()` 函数用于对数据进行聚合操作,能够很方便地进行各种汇总统计。
- 它可以直接应用于 DataFrame,也可以与 `groupby()` 一起使用,以便对分组后的数据进行聚合。
如果你有更多关于 `agg()` 的问题,或想了解更深入的内容,请随时告诉我!
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 |