华文杉 发表于 2022-5-1 17:55:06

怎么使用dataframe进行立即保存。

我在使用
df.drop(['b', 'a'], axis=1)
df.drop(columns=['b', 'a'])
代码之后想要删除相同的列,然后使用了这个代码:
df.drop_duplicates()
然后发现结果是我在使用前者之前的数据进行删除,请问怎样才能在使用将前两列代码删除相应的列之后使用后面的代码删除相同数据,在线等,急!

isdkz 发表于 2022-5-1 17:56:55

使用 inplace=True 进行原地操作
df.drop(columns=['b', 'a'], inplace=True)

华文杉 发表于 2022-5-1 18:04:24

isdkz 发表于 2022-5-1 17:56
使用 inplace=True 进行原地操作

df.drop_duplicates()
那在使用上面的代码删除了之后,数据也是通过
to_excel导出吗

isdkz 发表于 2022-5-1 18:15:05

华文杉 发表于 2022-5-1 18:04
df.drop_duplicates()
那在使用上面的代码删除了之后,数据也是通过
to_excel导出吗

可以用 to_csv 导出 csv 文件,也可以用 to_excel 导出 excel 表格,还有一些其它的格式:

>>> import pandas as pd
>>> for i in dir(pd.DataFrame):
...   if i.startswith('to'):
...      print(i)
...
to_clipboard
to_csv
to_dict
to_excel
to_feather
to_gbq
to_hdf
to_html
to_json
to_latex
to_markdown
to_numpy
to_parquet
to_period
to_pickle
to_records
to_sql
to_stata
to_string
to_timestamp
to_xarray
to_xml
>>>

华文杉 发表于 2022-5-1 18:24:01

isdkz 发表于 2022-5-1 18:15
可以用 to_csv 导出 csv 文件,也可以用 to_excel 导出 excel 表格,还有一些其它的格式:

name 'excel_writer' is not defined出现这个报错是什么原因啊

isdkz 发表于 2022-5-1 18:26:05

华文杉 发表于 2022-5-1 18:24
name 'excel_writer' is not defined出现这个报错是什么原因啊

你的代码中未定义 excel_writer,那个只是个参数,

你不用写的跟他一样,

df.to_excel('test.xlsx')

华文杉 发表于 2022-5-1 18:45:00

isdkz 发表于 2022-5-1 18:26
你的代码中未定义 excel_writer,那个只是个参数,

你不用写的跟他一样,


我在使用了这个方法以后确实得到了前者的导出数据结果,但是我在使用
df.drop_duplicates()
df.to_excel('test.xlsx')
之后发现导出的数据没有删除完全相同的行,这是怎么回事,而且发现导出的表格里最前方还多了一列(排序的

isdkz 发表于 2022-5-1 18:48:42

华文杉 发表于 2022-5-1 18:45
我在使用了这个方法以后确实得到了前者的导出数据结果,但是我在使用
df.drop_duplicates()
df.to_exce ...

第一:因为你没有原地操作

df.drop_duplicates(inplace=True)         

第二:to_excel 有个参数index 为是否写入索引,默认为True,你设为 False 即可

df.to_excel('test.xlsx', index=False)
页: [1]
查看完整版本: 怎么使用dataframe进行立即保存。