鱼C论坛

 找回密码
 立即注册
查看: 1812|回复: 6

[已解决]关于pandas使用的一个小问题,求大佬指教谢谢!

[复制链接]
发表于 2021-2-24 17:59:42 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
本帖最后由 曼查克 于 2021-2-24 18:14 编辑

先上代码!
  1. >>> df
  2.    城市     收入  年龄
  3. 一  北京  10000  50
  4. 二  广州  10000  43
  5. 三  天津   5000  34
  6. 四  上海   5002  40
  7. 五  杭州  40000  25
  8. 六  成都  50000  25
  9. 七  澳门   8000  45
  10. 八  南京   5000  32
  11. 九  北京   5000  25
  12. 十  北京   5000  25
  13. >>> df[df['收入'] + df['年龄'] == 5025 ]
  14.    城市    收入  年龄
  15. 九  北京  5000  25
  16. 十  北京  5000  25
  17. >>> df[df['收入'] + df['年龄'] in [5025] ]
  18. Traceback (most recent call last):
  19.   File "<pyshell#64>", line 1, in <module>
  20.     df[df['收入'] + df['年龄'] in [5025] ]
  21.   File "C:\python\lib\site-packages\pandas\core\generic.py", line 1329, in __nonzero__
  22.     raise ValueError(
  23. ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
复制代码


我想筛出收入+年龄等于  5025 or 5032的df
如上所示,单独筛等于一个值是可以做到的,但是我把所有的需求放到一个list里想一起筛的时候就出了问题。
大致原因我也想了一下,可能是因为 df['收入'] + df['年龄'] 对象是 Series,判断它等于一个值会返回一个布尔索引的Series,但是判断Series in list应该是不允许这样写的。
可是我就是想一次性完成多个条件的筛选,请问有办法实现吗?

当然,遍历list一个个筛选再拼接一定是可以的,只是太麻烦了些。
最佳答案
2021-2-25 09:03:57
曼查克 发表于 2021-2-25 08:52
感谢,这样确实是可以。但这个例子中只是两个条件,在实际应用中我会有很多个条件,这样写未免不大合适。
  1. df[(df['收入']+df['年龄']).map(lambda x :x==5025 or x == 5032)]
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复

使用道具 举报

发表于 2021-2-24 18:33:51 | 显示全部楼层
  1. >>> df[(df['收入']+df['年龄']==5025) | (df['收入']+df['年龄']==5032)]
  2.    城市    收入  年龄
  3. 八  南京  5000  32
  4. 九  北京  5000  25
  5. 十  北京  5000  25
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-2-25 08:52:06 | 显示全部楼层

感谢,这样确实是可以。但这个例子中只是两个条件,在实际应用中我会有很多个条件,这样写未免不大合适。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-2-25 09:03:57 | 显示全部楼层    本楼为最佳答案   
曼查克 发表于 2021-2-25 08:52
感谢,这样确实是可以。但这个例子中只是两个条件,在实际应用中我会有很多个条件,这样写未免不大合适。
  1. df[(df['收入']+df['年龄']).map(lambda x :x==5025 or x == 5032)]
复制代码
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-2-25 09:35:05 | 显示全部楼层

ok,感谢,我想要的是这样的:
  1. >>> df[(df['收入']+df['年龄']).map(lambda x :x in [5025,5032])]
  2.    城市    收入  年龄
  3. 八  南京  5000  32
  4. 九  北京  5000  25
  5. 十  北京  5000  25
复制代码

可是还是没有完全理解这句的意思。
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2021-2-25 09:55:25 | 显示全部楼层
曼查克 发表于 2021-2-25 09:35
ok,感谢,我想要的是这样的:

可是还是没有完全理解这句的意思。

pandas的map方法可以简而言之这样解释:对dataframe的每个元素执行func函数

这里面使用匿名函数lambda来筛选我们想要的数据

lambda x: x in [5025,5032]

合起来就是筛选满足条件 df['收入'] + df['年龄'] 之和 为5025或5032的选项
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2021-2-25 09:57:55 | 显示全部楼层
逃兵 发表于 2021-2-25 09:55
pandas的map方法可以简而言之这样解释:对dataframe的每个元素执行func函数

这里面使用匿名函数lambda ...

原来如此,这个是pandas的map方法啊,再次感谢!
想知道小甲鱼最近在做啥?请访问 -> ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2024-4-26 18:56

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表