gzj137070928 发表于 2020-12-15 15:47:08

pandas的数据清洗——删除重复数据

pandas的数据清洗——删除重复数据
可以用drop_duplicates函数删除重复数据。
import pandas as pd
col = ["apple", "pearl", "watermelon"] * 4
pri = * 4
df = pd.DataFrame({"fruit": col, "price" : pri})
print (df)
print ('查看重复数据:',df.duplicated())
df1 = df.drop_duplicates()
print (df1)

如果想保留重复出现最后出现的数据可以使用keep参数。
df2 = df.drop_duplicates(keep="last")
print (df2)
页: [1]
查看完整版本: pandas的数据清洗——删除重复数据