[已解决]关于pandas使用的一个小问题，求大佬指教谢谢！

曼查克 · 发表于 2021-2-24 17:59:42

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

本帖最后由曼查克于 2021-2-24 18:14 编辑

先上代码！

>>> df
城市收入年龄
一北京 10000 50
二广州 10000 43
三天津 5000 34
四上海 5002 40
五杭州 40000 25
六成都 50000 25
七澳门 8000 45
八南京 5000 32
九北京 5000 25
十北京 5000 25
>>> df[df['收入'] + df['年龄'] == 5025 ]
城市收入年龄
九北京 5000 25
十北京 5000 25
>>> df[df['收入'] + df['年龄'] in [5025] ]
Traceback (most recent call last):
File "<pyshell#64>", line 1, in <module>
df[df['收入'] + df['年龄'] in [5025] ]
File "C:\python\lib\site-packages\pandas\core\generic.py", line 1329, in __nonzero__
raise ValueError(
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

复制代码

我想筛出收入+年龄等于 5025 or 5032的df
如上所示，单独筛等于一个值是可以做到的，但是我把所有的需求放到一个list里想一起筛的时候就出了问题。
大致原因我也想了一下，可能是因为 df['收入'] + df['年龄'] 对象是 Series，判断它等于一个值会返回一个布尔索引的Series，但是判断Series in list应该是不允许这样写的。
可是我就是想一次性完成多个条件的筛选，请问有办法实现吗？

当然，遍历list一个个筛选再拼接一定是可以的，只是太麻烦了些。

最佳答案

月排行榜 / 总排行榜

逃兵

2021-2-25 09:03:57

曼查克发表于 2021-2-25 08:52
感谢，这样确实是可以。但这个例子中只是两个条件，在实际应用中我会有很多个条件，这样写未免不大合适。

df[(df['收入']+df['年龄']).map(lambda x :x==5025 or x == 5032)]

复制代码

跳转到最佳答案楼层

逃兵 · 发表于 2021-2-24 18:33:51

>>> df[(df['收入']+df['年龄']==5025) | (df['收入']+df['年龄']==5032)]
城市收入年龄
八南京 5000 32
九北京 5000 25
十北京 5000 25

复制代码

曼查克 · 发表于 2021-2-25 08:52:06

逃兵发表于 2021-2-24 18:33

感谢，这样确实是可以。但这个例子中只是两个条件，在实际应用中我会有很多个条件，这样写未免不大合适。

逃兵 · 发表于 2021-2-25 09:03:57

曼查克发表于 2021-2-25 08:52
感谢，这样确实是可以。但这个例子中只是两个条件，在实际应用中我会有很多个条件，这样写未免不大合适。

df[(df['收入']+df['年龄']).map(lambda x :x==5025 or x == 5032)]

复制代码

曼查克 · 发表于 2021-2-25 09:35:05

逃兵发表于 2021-2-25 09:03

ok，感谢，我想要的是这样的：

>>> df[(df['收入']+df['年龄']).map(lambda x :x in [5025,5032])]
城市收入年龄
八南京 5000 32
九北京 5000 25
十北京 5000 25

复制代码

可是还是没有完全理解这句的意思。

逃兵 · 发表于 2021-2-25 09:55:25

曼查克发表于 2021-2-25 09:35
ok，感谢，我想要的是这样的：

可是还是没有完全理解这句的意思。

pandas的map方法可以简而言之这样解释:对dataframe的每个元素执行func函数

这里面使用匿名函数lambda来筛选我们想要的数据

lambda x: x in [5025,5032]

合起来就是筛选满足条件 df['收入'] + df['年龄'] 之和为5025或5032的选项

曼查克 · 发表于 2021-2-25 09:57:55

逃兵发表于 2021-2-25 09:55
pandas的map方法可以简而言之这样解释:对dataframe的每个元素执行func函数

这里面使用匿名函数lambda ...

原来如此，这个是pandas的map方法啊，再次感谢！

账号		自动登录	找回密码
密码			立即注册