曼查克 发表于 2021-2-24 17:59:42

关于pandas使用的一个小问题,求大佬指教谢谢!

本帖最后由 曼查克 于 2021-2-24 18:14 编辑

先上代码!
>>> df
   城市   收入年龄
一北京1000050
二广州1000043
三天津   500034
四上海   500240
五杭州4000025
六成都5000025
七澳门   800045
八南京   500032
九北京   500025
十北京   500025
>>> df + df['年龄'] == 5025 ]
   城市    收入年龄
九北京500025
十北京500025
>>> df + df['年龄'] in ]
Traceback (most recent call last):
File "<pyshell#64>", line 1, in <module>
    df + df['年龄'] in ]
File "C:\python\lib\site-packages\pandas\core\generic.py", line 1329, in __nonzero__
    raise ValueError(
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

我想筛出收入+年龄等于5025 or 5032的df
如上所示,单独筛等于一个值是可以做到的,但是我把所有的需求放到一个list里想一起筛的时候就出了问题。
大致原因我也想了一下,可能是因为 df['收入'] + df['年龄'] 对象是 Series,判断它等于一个值会返回一个布尔索引的Series,但是判断Series in list应该是不允许这样写的。
可是我就是想一次性完成多个条件的筛选,请问有办法实现吗?

当然,遍历list一个个筛选再拼接一定是可以的,只是太麻烦了些。

逃兵 发表于 2021-2-24 18:33:51

>>> df[(df['收入']+df['年龄']==5025) | (df['收入']+df['年龄']==5032)]
   城市    收入年龄
八南京500032
九北京500025
十北京500025

曼查克 发表于 2021-2-25 08:52:06

逃兵 发表于 2021-2-24 18:33


感谢,这样确实是可以。但这个例子中只是两个条件,在实际应用中我会有很多个条件,这样写未免不大合适。

逃兵 发表于 2021-2-25 09:03:57

曼查克 发表于 2021-2-25 08:52
感谢,这样确实是可以。但这个例子中只是两个条件,在实际应用中我会有很多个条件,这样写未免不大合适。

df[(df['收入']+df['年龄']).map(lambda x :x==5025 or x == 5032)]

曼查克 发表于 2021-2-25 09:35:05

逃兵 发表于 2021-2-25 09:03


ok,感谢,我想要的是这样的:
>>> df[(df['收入']+df['年龄']).map(lambda x :x in )]
   城市    收入年龄
八南京500032
九北京500025
十北京500025
可是还是没有完全理解这句的意思。

逃兵 发表于 2021-2-25 09:55:25

曼查克 发表于 2021-2-25 09:35
ok,感谢,我想要的是这样的:

可是还是没有完全理解这句的意思。

pandas的map方法可以简而言之这样解释:对dataframe的每个元素执行func函数

这里面使用匿名函数lambda来筛选我们想要的数据

lambda x: x in

合起来就是筛选满足条件 df['收入'] + df['年龄'] 之和 为5025或5032的选项

曼查克 发表于 2021-2-25 09:57:55

逃兵 发表于 2021-2-25 09:55
pandas的map方法可以简而言之这样解释:对dataframe的每个元素执行func函数

这里面使用匿名函数lambda ...

原来如此,这个是pandas的map方法啊,再次感谢!
页: [1]
查看完整版本: 关于pandas使用的一个小问题,求大佬指教谢谢!