鱼C论坛

 找回密码
 立即注册
查看: 1872|回复: 5

[已解决]如何对csv文件内容去重并将重复列的数据求和

[复制链接]
发表于 2022-5-28 20:26:00 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
各位老师我需要将csv文件去重并对重复列所对应的数据求和。就是达到excel里面sumif函数的效果。是用pandas吗?如何操作谢谢老师能够给与讲解。谢谢了
最佳答案
2022-6-1 01:05:09


参考代码:
import pandas as pd

df = pd.read_csv("ceshi.csv", encoding="gbk")

# 去缺失行
df = df.dropna(axis=0, how='all')

# 分组求和
result = df.groupby(['区划'])['收入'].sum()

# 导出结果文件
result.to_excel("result.xlsx")

测试文件.rar

2.47 KB, 下载次数: 3

原始csv文件

希望取得的效果.rar

8.61 KB, 下载次数: 3

通过python处理后得到的文件

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2022-5-28 20:41:09 | 显示全部楼层
去认真学一遍pandas,这些问题基本上你都可以自己搞定。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-5-28 20:46:20 | 显示全部楼层
阿奇_o 发表于 2022-5-28 20:41
去认真学一遍pandas,这些问题基本上你都可以自己搞定。

老师能否再帮我看看。谢谢了。pandas我后面是要学习的。但目前比较急需要解决几个问题。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-5-28 22:21:24 | 显示全部楼层
本帖最后由 阿奇_o 于 2022-5-29 02:54 编辑
redaiconglin 发表于 2022-5-28 20:46
老师能否再帮我看看。谢谢了。pandas我后面是要学习的。但目前比较急需要解决几个问题。


着急?—— 那你 要么付费,要么自己学会"快速入门"和"搜索技巧"。
不然,没那么多"好人/闲人" 会帮你做两三次类似的问题。。

ps: 愿付费可以加我Q3130137034
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-5-29 11:40:30 From FishC Mobile | 显示全部楼层
阿奇_o 发表于 2022-5-28 22:21
着急?—— 那你 要么付费,要么自己学会"快速入门"和"搜索技巧"。
不然,没那么多"好人/闲人" 会帮 ...

谢谢。如果老师不愿意,我自己学习一下。没事的。能理解劳动都是要有收获的。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2022-6-1 01:05:09 | 显示全部楼层    本楼为最佳答案   


参考代码:
import pandas as pd

df = pd.read_csv("ceshi.csv", encoding="gbk")

# 去缺失行
df = df.dropna(axis=0, how='all')

# 分组求和
result = df.groupby(['区划'])['收入'].sum()

# 导出结果文件
result.to_excel("result.xlsx")

评分

参与人数 1荣誉 +5 鱼币 +5 贡献 +3 收起 理由
redaiconglin + 5 + 5 + 3 感谢老师的讲解。太谢谢了

查看全部评分

想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-11-18 01:26

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表