[已解决]pandas中如何方便实现excel中的countif函数

老笨啊 · 发表于 2019-5-10 19:47:10

马上注册，结交更多好友，享用更多功能^_^

您需要登录才可以下载或查看，没有账号？立即注册

x

如图所示，我需要统计每行中比指标值大的列的个数。。excel很容易用countif函数来计数。。
但是我用pandas死活搞不出结果来。。
我的代码是：
np.where(data[data.columns[1:]]> data['指标']).count(1) ---结果都是0
用:
(data[data.columns[1:]]> data['指标']).sum() ---结果也是0

求指点迷津

最佳答案

月排行榜 / 总排行榜

在东边

2019-5-10 22:48:13

data['count_if'] = data.apply(lambda x: sum(x['X1':'X4'] > x['指标']), axis=1)

复制代码

或者

data['count_if'] = data.apply(lambda x: np.where(x['X1': 'X4'] > x['指标'], 1, 0).sum(), axis=1)

复制代码

跳转到最佳答案楼层

在东边 · 发表于 2019-5-10 22:48:13

data['count_if'] = data.apply(lambda x: sum(x['X1':'X4'] > x['指标']), axis=1)

复制代码

或者

data['count_if'] = data.apply(lambda x: np.where(x['X1': 'X4'] > x['指标'], 1, 0).sum(), axis=1)

复制代码

老笨啊 · 发表于 2019-5-11 06:16:59

在东边发表于 2019-5-10 22:48
或者

一定要用apply方法么？
没有其他，如np.where或者.count的方法？

在东边 · 发表于 2019-5-11 19:18:52

老笨啊发表于 2019-5-11 06:16
一定要用apply方法么？
没有其他，如np.where或者.count的方法？

data['count_if'] = np.where(data[data.columns[1:]] > np.matrix(data['指标']).T, 1, 0).sum(axis=1)

复制代码

老笨啊 · 发表于 2019-5-13 08:06:35

在东边发表于 2019-5-11 19:18

想请教下：
1. 为什么指标的字段要转置处理下？
2. 转置符号之后的1,0是什么意思？

在东边 · 发表于 2019-5-14 15:03:57

老笨啊发表于 2019-5-13 08:06
想请教下：
1. 为什么指标的字段要转置处理下？
2. 转置符号之后的1,0是什么意思？

1. 转置是为了让 data[data.columns[1:]] 和指标列可以比较
假设你的数据是 10 行 5 列
data[data.columns[1:]] 的 shape 就是 (10, 4)
而 data['指标'] 是一个 Series，它的 shape 是 (10,)
利用 np.matrix 这个方法，可以将指标列转换成矩阵，但这个矩阵的 shape 是 (1, 10)
将矩阵转置，shape 就变成 (10, 1)，就可以和 data[data.columns[1:]] 比较了
2. 这里的 1 和 0 是传给 np.where 的第二和第三个参数
np.where 接收三个参数 condition, x , y
condition 是布尔型数组，x 是数组的元素为 True 时的取值，y 是数组的元素为 False 的取值
为了实现 Excel 里的 countif，只需让 x 为 1，y 为 0，然后再按行求和即可

其实不用 np.where 会更简单

data['count_if'] = (data[data.columns[1:]] > np.matrix(data['指标']).T).sum(axis=1)

复制代码

可以得到同样的结果

老笨啊 · 发表于 2019-5-14 18:41:37

在东边发表于 2019-5-14 15:03
1. 转置是为了让 data[data.columns[1:]] 和指标列可以比较
假设你的数据是 10 行 5 列
data[data.co ...

感谢热心帮忙~~

账号		自动登录	找回密码
密码			立即注册

[已解决]pandas中如何方便实现excel中的countif函数

马上注册，结交更多好友，享用更多功能^_^

浏览过的版块