关于pandas使用的一个小问题,求大佬指教谢谢!
本帖最后由 曼查克 于 2021-2-24 18:14 编辑先上代码!
>>> df
城市 收入年龄
一北京1000050
二广州1000043
三天津 500034
四上海 500240
五杭州4000025
六成都5000025
七澳门 800045
八南京 500032
九北京 500025
十北京 500025
>>> df + df['年龄'] == 5025 ]
城市 收入年龄
九北京500025
十北京500025
>>> df + df['年龄'] in ]
Traceback (most recent call last):
File "<pyshell#64>", line 1, in <module>
df + df['年龄'] in ]
File "C:\python\lib\site-packages\pandas\core\generic.py", line 1329, in __nonzero__
raise ValueError(
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
我想筛出收入+年龄等于5025 or 5032的df
如上所示,单独筛等于一个值是可以做到的,但是我把所有的需求放到一个list里想一起筛的时候就出了问题。
大致原因我也想了一下,可能是因为 df['收入'] + df['年龄'] 对象是 Series,判断它等于一个值会返回一个布尔索引的Series,但是判断Series in list应该是不允许这样写的。
可是我就是想一次性完成多个条件的筛选,请问有办法实现吗?
当然,遍历list一个个筛选再拼接一定是可以的,只是太麻烦了些。
>>> df[(df['收入']+df['年龄']==5025) | (df['收入']+df['年龄']==5032)]
城市 收入年龄
八南京500032
九北京500025
十北京500025 逃兵 发表于 2021-2-24 18:33
感谢,这样确实是可以。但这个例子中只是两个条件,在实际应用中我会有很多个条件,这样写未免不大合适。 曼查克 发表于 2021-2-25 08:52
感谢,这样确实是可以。但这个例子中只是两个条件,在实际应用中我会有很多个条件,这样写未免不大合适。
df[(df['收入']+df['年龄']).map(lambda x :x==5025 or x == 5032)] 逃兵 发表于 2021-2-25 09:03
ok,感谢,我想要的是这样的:
>>> df[(df['收入']+df['年龄']).map(lambda x :x in )]
城市 收入年龄
八南京500032
九北京500025
十北京500025
可是还是没有完全理解这句的意思。 曼查克 发表于 2021-2-25 09:35
ok,感谢,我想要的是这样的:
可是还是没有完全理解这句的意思。
pandas的map方法可以简而言之这样解释:对dataframe的每个元素执行func函数
这里面使用匿名函数lambda来筛选我们想要的数据
lambda x: x in
合起来就是筛选满足条件 df['收入'] + df['年龄'] 之和 为5025或5032的选项 逃兵 发表于 2021-2-25 09:55
pandas的map方法可以简而言之这样解释:对dataframe的每个元素执行func函数
这里面使用匿名函数lambda ...
原来如此,这个是pandas的map方法啊,再次感谢!
页:
[1]