明白了,你可以使用pandas库中的merge()函数和drop_duplicates()函数来实现这个需求。下面是一种实现方法:
首先,导入pandas库并读取两个DataFrame:import pandas as pd
df1 = pd.read_csv('甲.csv')
df2 = pd.read_csv('乙.csv')
接下来,使用merge()函数将两个DataFrame按照所有列合并,并设置参数indicator=True来添加一个特殊的"_merge"列,该列指示每行的合并方式:merged_df = pd.merge(df1, df2, on=list(df1.columns), how='outer', indicator=True)
然后,根据"_merge"列的值筛选出在甲表中和乙表中信息相同的那部分,并使用drop_duplicates()函数去除重复的行:df_unique = merged_df[merged_df['_merge'] != 'both'].drop_duplicates()
最后,你可以将去重后的结果保存为csv文件或进行其他处理:df_unique.to_csv('甲表去重.csv', index=False)
希望对你有所帮助!如果还有任何疑问,请随时追问。
以上回复来自 FishC AI 小助理,如未能正确解答您的问题,请继续追问。 |