鱼C论坛

 找回密码
 立即注册
查看: 1608|回复: 7

[已解决]小白救助

[复制链接]
发表于 2021-1-24 00:19:34 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
users = pd.read_csv('https://raw.githubusercontent.com/justmarkham/DAT8/master/data/u.user',
                      sep='|', index_col='user_id')
问题一:在这段代码中为什么sep='|'而不是sep=' '或'/t'?
问题二:index_col='user_id'是什么意思?
这些问题我都在百度找了好久,了解函数之类的,还是不能解决这种具体问题,望鱼友帮忙
最佳答案
2021-1-24 13:38:36
本帖最后由 suchocolate 于 2021-1-24 13:50 编辑
1476372787 发表于 2021-1-24 13:18
实际?是有什么样的规则吗?
行标签是什么意思?
小白的我不懂啊

  1. >>> help(pd.read_csv)
  2. ---省略部分--
  3. sep : str, default ','
复制代码

上面的意思是,sep这个参数默认是逗号,也就是以逗号作为分隔符。
假如你的原始数据是:1,2,3,4。那么默认不写sep参数,读取出来是没有问题的。
假如你的原始数据是:1|2|3|4。那么你就得改成sep='|',才能正常读取。
我说实际,就是因为看不到你的数据,所以让你替换成原始数据中实际的分隔符。
行标签,列名: Screenshot 2021-01-24 133642.jpg
多看教程:https://www.yiibai.com/pandas
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-1-24 11:32:52 | 显示全部楼层
sep='|'应该是表示字段(列)分隔符是‘|’吧。这个是由生成csv文件的时候决定的,读csv文件时,只能根据生成的csv文件来确定。
index_col字面意思应该是索引列。即user_id列是索引列,按这个列排序?
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-1-24 12:03:54 | 显示全部楼层
sep:原始数据中的分隔符,根据csv实际情况填写,默认是逗号,如果不是就得换成实际的。
index_cole:指定原始数据中哪一列作为frame中行标签,案例可以看这里:https://www.yiibai.com/pandas/python_pandas_io_tool.html
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-1-24 13:17:15 | 显示全部楼层
天下有雪 发表于 2021-1-24 11:32
sep='|'应该是表示字段(列)分隔符是‘|’吧。这个是由生成csv文件的时候决定的,读csv文件时,只能根据 ...

那什么样的文件要用什么样的分隔符呢?
索引列的意思是什么?按列排序?哪一列?
抱歉,我一窍不通,望解答
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-1-24 13:18:54 | 显示全部楼层
suchocolate 发表于 2021-1-24 12:03
sep:原始数据中的分隔符,根据csv实际情况填写,默认是逗号,如果不是就得换成实际的。
index_cole:指定 ...

实际?是有什么样的规则吗?
行标签是什么意思?
小白的我不懂啊
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-1-24 13:38:36 | 显示全部楼层    本楼为最佳答案   
本帖最后由 suchocolate 于 2021-1-24 13:50 编辑
1476372787 发表于 2021-1-24 13:18
实际?是有什么样的规则吗?
行标签是什么意思?
小白的我不懂啊

  1. >>> help(pd.read_csv)
  2. ---省略部分--
  3. sep : str, default ','
复制代码

上面的意思是,sep这个参数默认是逗号,也就是以逗号作为分隔符。
假如你的原始数据是:1,2,3,4。那么默认不写sep参数,读取出来是没有问题的。
假如你的原始数据是:1|2|3|4。那么你就得改成sep='|',才能正常读取。
我说实际,就是因为看不到你的数据,所以让你替换成原始数据中实际的分隔符。
行标签,列名: Screenshot 2021-01-24 133642.jpg
多看教程:https://www.yiibai.com/pandas
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-1-24 13:47:33 | 显示全部楼层
suchocolate 发表于 2021-1-24 13:38
服了。
上面的意思是,sep这个参数默认是逗号,也就是以逗号作为分隔符。
假如你的原始数据是:1,2,3,4 ...

哇哦,终于懂了,非常感谢
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-1-24 13:48:53 | 显示全部楼层
suchocolate 发表于 2021-1-24 13:38
服了。
上面的意思是,sep这个参数默认是逗号,也就是以逗号作为分隔符。
假如你的原始数据是:1,2,3,4 ...

今天我的贴子好像三个都是你是最佳答案
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-27 09:00

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表