弱弱的佳佳 发表于 2020-6-9 17:51:42

数据分析pandas一个小问题的思路,重点是思路

0         1
AAA   0.5
AAA   0.8
BBB      1.1
BBB      2.2
ccc      2.1
....

类似上面这种的两列cxcel数据,想实现第0列相同时,对第1列数据求和,大致结果时这样:

0       1
AAA   1.3
BBB   3.3
ccc    2.1
...

请教大佬思路,跪谢!!!

BIO-张磊 发表于 2020-6-9 17:51:43

本帖最后由 BIO-张磊 于 2020-6-9 19:08 编辑

可以使用pandas自带的groupby函数
import pandas as pd
data = pd.DataFrame({0:["AAA","AAA","BBB","BBB","CCC"],
                                       1:})

sum_data = data.groupby().sum()##其中0是列名,如果是字符串要加上双引号

Cool_Breeze 发表于 2020-6-9 18:02:49

本帖最后由 Cool_Breeze 于 2020-6-9 18:21 编辑

字典,将0列字符串做key!第一次出现添加到字典中,如果已在字典中,将对应数据加上key的值!

BIO-张磊 发表于 2020-6-9 19:08:50

满意请采纳

弱弱的佳佳 发表于 2020-6-9 19:29:11

BIO-张磊 发表于 2020-6-9 19:08
满意请采纳

请问大佬,这样操作完了 导出怎么写?

弱弱的佳佳 发表于 2020-6-9 19:34:14

弱弱的佳佳 发表于 2020-6-9 19:29
请问大佬,这样操作完了 导出怎么写?

大佬我会了 感谢!!!

BIO-张磊 发表于 2020-6-9 19:38:01

弱弱的佳佳 发表于 2020-6-9 19:34
大佬我会了 感谢!!!

不用谢,多用,看看别人的博客,pandas还有很多你想不到的功能,如果pandas的函数满足不了的你的想法,还可以使用for循环一个个争对的修改,高级一点可以了解一下pandas的apply方法,他可以传入你自己定义的函数
页: [1]
查看完整版本: 数据分析pandas一个小问题的思路,重点是思路