liusy202020 发表于 2022-1-18 20:27:56

不同名称去重复

本帖最后由 liusy202020 于 2022-1-18 20:32 编辑

如何将d列有重复的去重复,对于重复的名称只保留1行数据,其中f列对应的是和d列名称有重复的。有存在与在f列d列名称中两个重复的名称都相互备注出来了,如果从f列直接删除就会删除需要保留的数据,就是同一个医院在D列名称中可能存在2种或许2种以上的不同名称。

z5560636 发表于 2022-1-19 10:38:59

用 pandas 读 excel

df = pandas.read_excel(...)

然后:

df = df.drop_duplicates(['列名'])

z5560636 发表于 2022-1-19 10:59:18

import pandas as pd

df = pd.read_excel('111ccd.xlsx', sheet_name=None)

ccd = df['1111'].drop_duplicates(['名称'])

ccd.to_excel('ccd222.xlsx', index=False)

print(ccd)

代码帮你写好了, 你这文件隐藏的东西有点多啊。

阿奇_o 发表于 2022-1-19 12:58:41

要么统一用一个名称,要么用 名称,别名1, 别名2。

ps: 亲,您是血液科的么,全部红色字体。。您看得不眼累么。。

liusy202020 发表于 2022-1-19 15:51:04

阿奇_o 发表于 2022-1-19 12:58
要么统一用一个名称,要么用 名称,别名1, 别名2。

ps: 亲,您是血液科的么,全部红色字体。。您看得不 ...

{:5_109:}领导要求的标红色
页: [1]
查看完整版本: 不同名称去重复