wp231957 发表于 2024-9-27 10:13:32

关于分组求和的问题

有这样一组数据
    种类    型号 交易方向    数量
0   车辆    奔驰   买入   3.0
1   飞机A330   买入   8.0
2   车辆    宝马   买入11.0
3   飞机B777   卖出   4.0
4   火车   和谐号   买入   6.0
5   车辆    奥迪   卖出16.0
6   车辆    奔驰   卖出   5.0
7   飞机C919   卖出   7.0
8   车辆    宝马   卖出10.0
9   火车   复兴号   买入15.0
11火车   和谐号   卖出   8.0
12火车   和谐号   买入   9.0
13飞机B777   卖出   1.0
14车辆    宝马   买入   2.0
我想求得 在种类和型号都一样的时候,挑选买入或卖出的最大值,另一些数据舍去   这个该如何弄

FishC 发表于 2024-9-27 10:14:44

你可以使用Python的`pandas`库来实现这个需求。以下是解决这个问题的步骤:

1. 导入`pandas`库。
2. 将数据加载到一个DataFrame中。
3. 使用`groupby`和`apply`方法,并在自定义函数中获取最大值。

下面是代码示例:

import pandas as pd

# 创建 DataFrame
data = {
    "种类": ["车辆", "飞机", "车辆", "飞机", "火车", "车辆", "车辆", "飞机", "车辆", "火车", "火车", "火车", "火车", "车辆"],
    "型号": ["奔驰", "A330", "宝马", "B777", "和谐号", "奥迪", "奔驰", "C919", "宝马", "复兴号", "和谐号", "和谐号", "B777", "宝马"],
    "交易方向": ["买入", "买入", "买入", "卖出", "买入", "卖出", "卖出", "卖出", "卖出", "买入", "卖出", "买入", "卖出", "买入"],
    "数量":
}

df = pd.DataFrame(data)

# 使用 groupby 和 apply 方法,获取每个分组的最大值
result = df.groupby(["种类", "型号", "交易方向"]).apply(lambda x: x.loc.idxmax()]).reset_index(drop=True)

print(result)

这个代码的工作原理如下:
1. `groupby(["种类", "型号", "交易方向"])`:按种类、型号和交易方向分组。
2. `apply(lambda x: x.loc.idxmax()])`:对每个分组应用一个自定义函数,找出数量上的最大值所在的行。
3. `.reset_index(drop=True)`:重置索引。

这段代码执行后,`result`会包含每个种类和型号在买入或卖出方向上的最大值。

请根据实际情况调整数据和列名。

以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。
页: [1]
查看完整版本: 关于分组求和的问题