鱼C论坛

 找回密码
 立即注册
查看: 1373|回复: 1

[已解决]python

[复制链接]
发表于 2020-8-21 22:10:01 | 显示全部楼层 |阅读模式
10鱼币
为什么循环读取行然后进行添加数据的操作没起作用



  1. from numpy import *
  2. # 导入运算符模块
  3. import matplotlib as mpl
  4. import matplotlib.pyplot as plt


  5. def file2matrix(filename):
  6.     '''将待处理的数据格式转换成分类器可以接受的格式
  7.     将文本记录转换为Numpy的解析程序
  8.     该函数输入为文本字符串,输出为训练样本矩阵和类标签向量'''
  9.     fr = open(filename)
  10.     # 得到文件行数
  11.     numberOfLines = len(fr.readlines())  # get the number of lines in the file
  12.     # 创建(行数,特征数)以零填充的矩阵Numpy
  13.     returnMat = zeros((numberOfLines, 3))  # prepare matrix to return
  14.     # 创建一个列表存放标签值
  15.     classLabelVector = []  # prepare labels return
  16.     # 解析文件数据到列表
  17.     index = 0
  18.     for line in fr.readlines():
  19.         # strip截取掉所有回车字符
  20.         line = line.strip()
  21.         # 将整行数据以’\t'为分隔符分割成一个元素列表
  22.         listFromLine = line.split('\t')
  23.         returnMat[index, :] = listFromLine[0:3]
  24.         # 列表中存储的元素值为整型,否则python语言会将这些元素当做字符串处理
  25.         classLabelVector.append(int(listFromLine[-1]))
  26.         index += 1
  27.     return returnMat, classLabelVector


  28. if __name__ == '__main__':
  29.     datingDataMat, datingLabels = file2matrix('datingTestSet2.txt')
  30.     print(datingDataMat)
  31.     print(datingLabels)
  32.     #  分析数据-使用mpl创建散点图
  33.     fig = plt.figure()
  34.     ax = fig.add_subplot(111)
  35.     ax.scatter(datingDataMat[:, 1], datingDataMat[:, 2])
  36.     plt.show()
复制代码
最佳答案
2020-8-21 22:10:02


你前面 readlines 读取全部文件内容了,此时文件指针已经到末尾了

你需要 seek(0) 移动下文件指针,参考代码:



  1. from numpy import *
  2. # 导入运算符模块
  3. import matplotlib as mpl
  4. import matplotlib.pyplot as plt


  5. def file2matrix(filename):
  6.     '''将待处理的数据格式转换成分类器可以接受的格式
  7.     将文本记录转换为Numpy的解析程序
  8.     该函数输入为文本字符串,输出为训练样本矩阵和类标签向量'''
  9.     fr = open(filename)
  10.     # 得到文件行数
  11.     numberOfLines = len(fr.readlines())  # get the number of lines in the file
  12.     # 创建(行数,特征数)以零填充的矩阵Numpy
  13.     returnMat = zeros((numberOfLines, 3))  # prepare matrix to return
  14.     # 创建一个列表存放标签值
  15.     classLabelVector = []  # prepare labels return
  16.     # 解析文件数据到列表
  17.     index = 0
  18.     fr.seek(0)
  19.     for line in fr.readlines():
  20.         # strip截取掉所有回车字符
  21.         line = line.strip()
  22.         # 将整行数据以’\t'为分隔符分割成一个元素列表
  23.         listFromLine = line.split('\t')
  24.         returnMat[index, :] = listFromLine[0:3]
  25.         # 列表中存储的元素值为整型,否则python语言会将这些元素当做字符串处理
  26.         classLabelVector.append(int(listFromLine[-1]))
  27.         index += 1
  28.     return returnMat, classLabelVector


  29. if __name__ == '__main__':
  30.     datingDataMat, datingLabels = file2matrix('datingTestSet2.txt')
  31.     print(datingDataMat)
  32.     print(datingLabels)
  33.     #  分析数据-使用mpl创建散点图
  34.     fig = plt.figure()
  35.     ax = fig.add_subplot(111)
  36.     ax.scatter(datingDataMat[:, 1], datingDataMat[:, 2])
  37.     plt.show()
复制代码

datingTestSet2.rar

12.42 KB, 下载次数: 2

最佳答案

查看完整内容

你前面 readlines 读取全部文件内容了,此时文件指针已经到末尾了 你需要 seek(0) 移动下文件指针,参考代码:
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2020-8-21 22:10:02 | 显示全部楼层    本楼为最佳答案   


你前面 readlines 读取全部文件内容了,此时文件指针已经到末尾了

你需要 seek(0) 移动下文件指针,参考代码:



  1. from numpy import *
  2. # 导入运算符模块
  3. import matplotlib as mpl
  4. import matplotlib.pyplot as plt


  5. def file2matrix(filename):
  6.     '''将待处理的数据格式转换成分类器可以接受的格式
  7.     将文本记录转换为Numpy的解析程序
  8.     该函数输入为文本字符串,输出为训练样本矩阵和类标签向量'''
  9.     fr = open(filename)
  10.     # 得到文件行数
  11.     numberOfLines = len(fr.readlines())  # get the number of lines in the file
  12.     # 创建(行数,特征数)以零填充的矩阵Numpy
  13.     returnMat = zeros((numberOfLines, 3))  # prepare matrix to return
  14.     # 创建一个列表存放标签值
  15.     classLabelVector = []  # prepare labels return
  16.     # 解析文件数据到列表
  17.     index = 0
  18.     fr.seek(0)
  19.     for line in fr.readlines():
  20.         # strip截取掉所有回车字符
  21.         line = line.strip()
  22.         # 将整行数据以’\t'为分隔符分割成一个元素列表
  23.         listFromLine = line.split('\t')
  24.         returnMat[index, :] = listFromLine[0:3]
  25.         # 列表中存储的元素值为整型,否则python语言会将这些元素当做字符串处理
  26.         classLabelVector.append(int(listFromLine[-1]))
  27.         index += 1
  28.     return returnMat, classLabelVector


  29. if __name__ == '__main__':
  30.     datingDataMat, datingLabels = file2matrix('datingTestSet2.txt')
  31.     print(datingDataMat)
  32.     print(datingLabels)
  33.     #  分析数据-使用mpl创建散点图
  34.     fig = plt.figure()
  35.     ax = fig.add_subplot(111)
  36.     ax.scatter(datingDataMat[:, 1], datingDataMat[:, 2])
  37.     plt.show()
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-6-26 02:38

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表