鱼C论坛

 找回密码
 立即注册
查看: 147|回复: 3

求助一个pandas提取数据合并数据的问题

[复制链接]
发表于 2024-7-23 08:45:12 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1        使用python的pandas,提取excel"生成数据.xlsx"中的列“管线号”,“焊缝类型”,“焊缝材质”,“焊缝数量”,其中注意对“焊缝数量”列只提取数量不为0的列。生成一个df1备用。
2        使用python的pandas,提取excel"提取数据.xlsx"中的列“管线号”,“焊缝类型2”,“焊缝材质2”,“焊缝数量2”,其中注意对“焊缝数量2”列只提取数量不为0的列。生成一个df2备用。
3        对提取的df2中的“焊缝类型2”,“焊缝材质2”,“焊缝数量2”对应改名为“焊缝类型”,“焊缝材质”,“焊缝数量”
4        将df1,df2合并为一个df_merge,并对“管线号”,“焊缝类型”,“焊缝材质”相同列的“焊缝数量”进行求和
5        对df_merge根据“管线号”,“焊缝类型”,“焊缝材质”进行排序。
6        输出到"提取数据.xlsx"
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2024-7-23 08:57:06 | 显示全部楼层
这不就是多一个排序吗
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2024-7-23 09:00:31 | 显示全部楼层
import pandas as pd

# 读取生成数据.xlsx文件
df1 = pd.read_excel("原始数据.xlsx", usecols=["管线号", "焊缝类型", "工艺卡编号", "焊缝数量"])

# 只保留焊缝数量不为0的行
df1 = df1[df1["焊缝数量"] != 0]

# 读取提取数据.xlsx文件
df2 = pd.read_excel("原始数据.xlsx", usecols=["管线号", "焊缝类型2", "工艺卡编号2", "焊缝数量2"])

# 只保留焊缝数量2不为0的行
df2 = df2[df2["焊缝数量2"] != 0]

# 对df2中的列名进行重命名
df2.rename(columns={"焊缝类型2": "焊缝类型", "工艺卡编号2": "工艺卡编号", "焊缝数量2": "焊缝数量"}, inplace=True)

# 合并df1和df2
df_merge = pd.concat([df1, df2])

# 对相同的“管线号”,“焊缝类型”,“焊缝材质”进行分组,并对“焊缝数量”求和
df_merge = df_merge.groupby(["管线号", "焊缝类型", "工艺卡编号"], as_index=False).agg({"焊缝数量": "sum"})

# 根据“管线号”,“焊缝类型”,“焊缝材质”进行排序
df_merge.sort_values(by=["管线号", "焊缝类型", "工艺卡编号"], inplace=True)

# 输出到提取数据.xlsx文件
df_merge.to_excel("提取数据.xlsx", index=False)


实测ai这个可行,通过了
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2024-7-23 09:00:56 | 显示全部楼层
是的,就看看这里的算法比较下
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-12-23 00:27

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表