鱼C论坛

 找回密码
 立即注册
查看: 2615|回复: 4

[已解决]关于pandas删除行的操作问题

[复制链接]
发表于 2020-2-20 09:48:15 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
  1. import pandas as pd
  2. import sys

  3. input_file = sys.argv[1]
  4. output_file = sys.argv[2]

  5. data_frame = pd.read_csv(input_file, header = None)
  6. data_frame = data_frame.drop([0, 1, 2, 16, 17, 18])
  7. data_frame.columns = data_frame.iloc[0]
  8. data_frame = data_frame.reindex(data_frame.index.drop(3))
  9. data_frame.to_csv(output_file, index = False)
复制代码

删除无用的行,有两个问题搞不懂:
data_frame = data_frame.reindex(data_frame.index.drop(3))这句话是什么意思?reindex不是在插入行或者列的时候使用的吗?


为什么不写这句,输出的文件会有两行一样的列名?


最佳答案
2020-2-25 16:24:13
  1. import pandas as pd
  2. import sys

  3. input_file = sys.argv[1]
  4. output_file = sys.argv[2]

  5. data_frame = pd.read_csv(input_file, header = None)
  6. data_frame = data_frame.drop([0, 1, 2, 16, 17, 18])
  7. data_frame.columns = data_frame.iloc[1:]
  8. data_frame.to_csv(output_file, index = False)
复制代码

这样不是更简单

supplier_data_unnecessary_header_footer.zip

434 Bytes, 下载次数: 1

小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

 楼主| 发表于 2020-2-23 19:29:30 | 显示全部楼层
求捞
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-2-25 15:26:28 | 显示全部楼层
本帖最后由 _摆架_回宫、 于 2020-2-25 15:27 编辑

reindex()是重新索引
data_frame.index.drop(3)是删除index3的索引
写在一起就是删除index = 3的索引后重新索引

x =data_frame.index.drop(3)
x
Int64Index([4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15], dtype='int64')
data_frame = data_frame.reindex(x)
data_frame
意思是一样的
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2020-2-25 16:24:13 | 显示全部楼层    本楼为最佳答案   
  1. import pandas as pd
  2. import sys

  3. input_file = sys.argv[1]
  4. output_file = sys.argv[2]

  5. data_frame = pd.read_csv(input_file, header = None)
  6. data_frame = data_frame.drop([0, 1, 2, 16, 17, 18])
  7. data_frame.columns = data_frame.iloc[1:]
  8. data_frame.to_csv(output_file, index = False)
复制代码

这样不是更简单
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2020-2-26 20:05:57 | 显示全部楼层
本帖最后由 ilsoviet1917 于 2020-2-26 21:27 编辑
_摆架_回宫、 发表于 2020-2-25 15:26
reindex()是重新索引
data_frame.index.drop(3)是删除index3的索引
写在一起就是删除index = 3的索引后重 ...


按说把index = 3删除后,就没有['Supplier Name', 'Invoice Number', 'Part Number', 'Cost', 'Purchase Date']这一行了呀,怎么reindex以后,这一行还是有的呢?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2026-3-2 16:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表