pandas的数据清洗——删除重复数据
pandas的数据清洗——删除重复数据可以用drop_duplicates函数删除重复数据。
import pandas as pd
col = ["apple", "pearl", "watermelon"] * 4
pri = * 4
df = pd.DataFrame({"fruit": col, "price" : pri})
print (df)
print ('查看重复数据:',df.duplicated())
df1 = df.drop_duplicates()
print (df1)
如果想保留重复出现最后出现的数据可以使用keep参数。
df2 = df.drop_duplicates(keep="last")
print (df2)
页:
[1]