鱼C论坛

 找回密码
 立即注册
查看: 2082|回复: 1

数据转换

[复制链接]
发表于 2023-10-24 16:05:14 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
现在有一个train1.csv的光谱数据,有855行和890列,现在需要将其转换为三维时间序列数据(855,89,10),将890列平均分成10份,每89列为一个时间维度,每一个时间维度都为其添加时间索引。将转换后的文件保存为train_time.csv

“发生异常: ValueError
Shape of passed values is (855, 890), indices imply (855, 10)
  File "D:\0000可见光2\程序\MiniRocket\Test5.py", line 29, in <module>
    reshaped_df = pd.DataFrame(reshaped_data_2d, columns=time_index.tolist())
ValueError: Shape of passed values is (855, 890), indices imply (855, 10)”

  1. import pandas as pd
  2. import numpy as np

  3. # 读取CSV文件
  4. data = pd.read_csv('train1.csv')

  5. # 将数据转换为NumPy数组
  6. data_array = data.to_numpy()

  7. # 将数据重新排列成三维数组(855, 89, 10)
  8. num_rows, num_cols = data_array.shape
  9. num_time_dimensions = 10
  10. num_columns_per_time_dimension = num_cols // num_time_dimensions

  11. reshaped_data = np.zeros((num_rows, num_columns_per_time_dimension, num_time_dimensions))

  12. for i in range(num_time_dimensions):
  13.     start_col = i * num_columns_per_time_dimension
  14.     end_col = (i + 1) * num_columns_per_time_dimension
  15.     reshaped_data[:, :, i] = data_array[:, start_col:end_col]

  16. # 为每个时间维度添加时间索引
  17. time_index = np.arange(1, num_time_dimensions + 1)

  18. # 转换为2D数组
  19. reshaped_data_2d = reshaped_data.reshape(num_rows, -1)

  20. # 创建新的DataFrame并保存为train_time.csv
  21. reshaped_df = pd.DataFrame(reshaped_data_2d, columns=time_index.tolist())
  22. reshaped_df.to_csv('train_time.csv', index=False)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2023-10-24 16:05:57 | 显示全部楼层
问题的原因在于reshaped_data_2d的形状与time_index的形状不匹配。根据错误提示,传递的值的形状为(855, 890),而索引暗示的形状为(855, 10)。

解决这个问题的方法是使用reshape函数将reshaped_data转换为2D数组时,指定正确的形状。在这种情况下,我们需要将reshaped_data从形状(855, 89, 10)转换为形状(855, 890)。

以下是修改后的代码:

  1. import pandas as pd
  2. import numpy as np

  3. # 读取CSV文件
  4. data = pd.read_csv('train1.csv')

  5. # 将数据转换为NumPy数组
  6. data_array = data.to_numpy()

  7. # 将数据重新排列成三维数组(855, 89, 10)
  8. num_rows, num_cols = data_array.shape
  9. num_time_dimensions = 10
  10. num_columns_per_time_dimension = num_cols // num_time_dimensions

  11. reshaped_data = np.zeros((num_rows, num_columns_per_time_dimension, num_time_dimensions))

  12. for i in range(num_time_dimensions):
  13.     start_col = i * num_columns_per_time_dimension
  14.     end_col = (i + 1) * num_columns_per_time_dimension
  15.     reshaped_data[:, :, i] = data_array[:, start_col:end_col]

  16. # 为每个时间维度添加时间索引
  17. time_index = np.arange(1, num_columns_per_time_dimension + 1)

  18. # 转换为2D数组
  19. reshaped_data_2d = reshaped_data.reshape(num_rows, -1)

  20. # 创建新的DataFrame并保存为train_time.csv
  21. reshaped_df = pd.DataFrame(reshaped_data_2d, columns=time_index.tolist())
  22. reshaped_df.to_csv('train_time.csv', index=False)
复制代码


这样修改后的代码应该能够正确地将数据转换为三维时间序列数据,并保存为train_time.csv文件。
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-4-22 19:24

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表