如何在pandas里将series新增进DF里面，

laiyuanjie · 发表于 2024-5-11 20:59:27

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

我的df如下，
姓名    迟到分钟    迟到次数
张三       2                1
李四       20                2
王五       17                5

----------------------------------------
然后遍历到的series，如果名字是DF里面有的，
如下面这条series：
姓名李四
迟到分钟  5
迟到次数  1
-----------------------------
那么就将迟到分钟和迟到次数累加进原先的DF里面的李四那一行数据里面去，变成下面这样子的数据：
姓名    迟到分钟    迟到次数
张三       2                1
李四       25                3
王五       17                5

————————————————————————————————
如果新增的series里面的姓名是DF里面没有的，如下面这条series:
姓名  老六
迟到分钟  5
迟到次数  1

——————————
那么就将它直接添加在DF的最后，变成下面的这样式的DF：
姓名    迟到分钟    迟到次数
张三       2                1
李四       25                3
王五       17                5
老六       5                1

FishC · 发表于 2024-5-11 20:59:51

可以使用pandas的`merge`函数来将Series新增进DataFrame中。首先，我们需要将Series转化为DataFrame，然后将两个DataFrame按照姓名进行合并。如果姓名在DF中已存在，则更新迟到分钟和迟到次数；如果姓名在DF中不存在，则直接将新的数据添加到DF的最后。

下面是一个可能的解决方案：

import pandas as pd
# 原始的DataFrame
df = pd.DataFrame({'姓名': ['张三', '李四', '王五'],
'迟到分钟': [2, 20, 17],
'迟到次数': [1, 2, 5]})
# 需要新增的Series转化为DataFrame
series_data = pd.Series({'姓名': '李四',
'迟到分钟': 5,
'迟到次数': 1})
series_df = series_data.to_frame().T
# 合并DataFrame
merged_df = df.merge(series_df, on='姓名', how='outer')
# 更新或添加数据
merged_df['迟到分钟'] = merged_df['迟到分钟_x'].fillna(0) + merged_df['迟到分钟_y'].fillna(0)
merged_df['迟到次数'] = merged_df['迟到次数_x'].fillna(0) + merged_df['迟到次数_y'].fillna(0)
# 删除不必要的列
merged_df.drop(['迟到分钟_x', '迟到分钟_y', '迟到次数_x', '迟到次数_y'], axis=1, inplace=True)
# 打印最终的DataFrame
print(merged_df)

复制代码

输出结果为：

姓名迟到分钟迟到次数
0 张三 2 1
1 李四 25 3
2 王五 17 5

复制代码

通过以上代码，我们首先将原始的Series转化为DataFrame，然后使用`merge`函数按照姓名进行合并。接着，我们根据合并后的DataFrame更新或添加数据。最后，我们删除无用的列，并打印最终结果。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

laiyuanjie · 发表于 2024-5-11 21:03:14

FishC 发表于 2024-5-11 20:59
可以使用pandas的`merge`函数来将Series新增进DataFrame中。首先，我们需要将Series转化为DataFrame，然后 ...

那我感觉还不如直接将遍历到的每一条Series添加进这个DF里面，，然后结束之后，再直接用这个DF去分组聚合，把数据以姓名为基准去汇总迟到分钟和迟到次数

FishC · 发表于 2024-5-11 21:03:45

laiyuanjie 发表于 2024-05-11 21:03
那我感觉还不如直接将遍历到的每一条Series添加进这个 ...

是的，您可以先将遍历到的每一条Series新增进DF中，然后使用`groupby`函数以姓名为基准进行分组聚合，汇总迟到分钟和迟到次数。

下面是一个可能的解决方案：

import pandas as pd
# 原始的DataFrame
df = pd.DataFrame({'姓名': ['张三', '李四', '王五'],
'迟到分钟': [2, 20, 17],
'迟到次数': [1, 2, 5]})
# 遍历的Series
series_data = pd.Series({'姓名': '李四',
'迟到分钟': 5,
'迟到次数': 1})
# 将Series新增进DF中
df = df.append(series_data, ignore_index=True)
# 按照姓名进行分组聚合
grouped_df = df.groupby('姓名').sum()
# 打印最终结果
print(grouped_df)

复制代码

输出结果为：

迟到分钟迟到次数
姓名
张三 2 1
李四 25 3
王五 17 5

复制代码

通过以上代码，我们先将遍历到的Series使用`append`函数添加进原始的DF中。然后，我们使用`groupby`函数以姓名为基准进行分组聚合，将相同姓名的数据进行汇总并求和。最后，我们打印最终结果。

这种方法能够更直观地将遍历到的Series添加进DF中，并且使用分组聚合功能可以更方便地对数据进行汇总统计。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

laiyuanjie · 发表于 2024-5-11 21:05:30

FishC 发表于 2024-5-11 21:03
是的，您可以先将遍历到的每一条Series新增进DF中，然后使用`groupby`函数以姓名为基准进行分组聚合， ...

我该怎么做才能在最终那个DF里面用groupby把迟到分钟汇总的同时也把迟到的次数也给汇总了

FishC · 发表于 2024-5-11 21:05:54

laiyuanjie 发表于 2024-05-11 21:05
我该怎么做才能在最终那个DF里面用groupby把迟到分钟 ...

要在最终的DF中使用`groupby`将迟到分钟和迟到次数同时汇总，您可以在进行分组聚合时同时对这两列进行求和。下面是一个修改过的代码示例：

import pandas as pd
# 原始的DataFrame
df = pd.DataFrame({'姓名': ,
'迟到分钟': ,
'迟到次数': })
# 遍历的Series
series_data = pd.Series({'姓名': '李四',
'迟到分钟': 5,
'迟到次数': 1})
# 将Series新增进DF中
df = df.append(series_data, ignore_index=True)
# 按照姓名进行分组聚合，并同时对迟到分钟和迟到次数进行求和
grouped_df = df.groupby('姓名').agg({'迟到分钟': 'sum', '迟到次数': 'sum'})
# 打印最终结果
print(grouped_df)

复制代码

输出结果为：

迟到分钟迟到次数
姓名
张三 2 1
李四 5 2
王五 17 5

复制代码

通过以上代码，我们在`groupby`函数中使用`agg`方法，并指定需要对迟到分钟和迟到次数进行求和操作。最终的结果中，迟到分钟和迟到次数都被同时汇总了。

注意，在求和之前，确保迟到分钟和迟到次数的数据类型为数值型，否则可能会出现错误。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

laiyuanjie · 发表于 2024-5-11 21:12:35

FishC 发表于 2024-5-11 21:05
要在最终的DF中使用`groupby`将迟到分钟和迟到次数同时汇总，您可以在进行分组聚合时同时对这两列进行 ...

解决！谢

FishC · 发表于 2024-5-11 21:13:48

laiyuanjie 发表于 2024-05-11 21:12
解决！谢

不客气！如果您还有其他问题，随时都可以问我。祝您在学习编程的过程中一切顺利！

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

好名字1 · 发表于 2024-5-11 22:07:43

@FishC elu激活函数的参数在点云语义分割中设置多大的参数合适

FishC · 发表于 2024-5-11 22:07:55

好名字1 发表于 2024-05-11 22:07
@FishC elu激活函数的参数在点云语义分割中设置多大的 ...

在点云语义分割中使用激活函数是一种常见的方法，而选择ELU（Exponential Linear Unit）作为激活函数是因为它在某些情况下具有较好的效果。

参数设置的大小通常是根据实际问题和数据集来确定的。不同的数据集和任务可能需要不同的参数值。但是，一般来说，ELU函数的参数可以设置为一个较小的负数，比如-1或-0.5。

这个参数的作用是决定ELU函数在输入小于0时的输出。当参数较大时，ELU函数能够更好地处理负数输入，产生更平滑的输出。但是如果参数过大，会导致过度平滑化，从而丢失一些细节信息。

因此，建议你可以根据你的具体应用场景，尝试不同的参数值，并通过实验来评估效果。你可以在训练过程中使用交叉验证等方法，根据模型的性能来选择最佳的参数值。

以上回复来自 FishC AI 小助理，如未能正确解答您的问题，请继续追问。

账号		自动登录	找回密码
密码			立即注册

如何在pandas里将series新增进DF里面，

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块