鱼C论坛

 找回密码
 立即注册
查看: 4558|回复: 6

[已解决]pandas中如何方便实现excel中的countif函数

[复制链接]
发表于 2019-5-10 19:47:10 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能^_^

您需要 登录 才可以下载或查看,没有账号?立即注册

x
QQ图片20190510193956.png

如图所示,我需要统计每行中比指标值大的列的个数。。excel很容易用countif函数来计数。。
但是我用pandas死活搞不出结果来。。
我的代码是:
np.where(data[data.columns[1:]]> data['指标']).count(1)   ---结果都是0
用:
(data[data.columns[1:]]> data['指标']).sum() ---结果也是0

求指点迷津
最佳答案
2019-5-10 22:48:13
  1. data['count_if'] = data.apply(lambda x: sum(x['X1':'X4'] > x['指标']), axis=1)
复制代码

或者
  1. data['count_if'] = data.apply(lambda x: np.where(x['X1': 'X4'] > x['指标'], 1, 0).sum(), axis=1)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复

使用道具 举报

发表于 2019-5-10 22:48:13 | 显示全部楼层    本楼为最佳答案   
  1. data['count_if'] = data.apply(lambda x: sum(x['X1':'X4'] > x['指标']), axis=1)
复制代码

或者
  1. data['count_if'] = data.apply(lambda x: np.where(x['X1': 'X4'] > x['指标'], 1, 0).sum(), axis=1)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-5-11 06:16:59 | 显示全部楼层

一定要用apply方法么?
没有其他,如np.where或者.count的方法?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-5-11 19:18:52 | 显示全部楼层
老笨啊 发表于 2019-5-11 06:16
一定要用apply方法么?
没有其他,如np.where或者.count的方法?
  1. data['count_if'] = np.where(data[data.columns[1:]] > np.matrix(data['指标']).T, 1, 0).sum(axis=1)
复制代码
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-5-13 08:06:35 | 显示全部楼层

想请教下:
1. 为什么指标的字段要转置处理下?
2. 转置符号之后的1,0是什么意思?
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

发表于 2019-5-14 15:03:57 | 显示全部楼层
老笨啊 发表于 2019-5-13 08:06
想请教下:
1. 为什么指标的字段要转置处理下?
2. 转置符号之后的1,0是什么意思?

1. 转置是为了让 data[data.columns[1:]] 和 指标列 可以比较
假设你的数据是 10 行 5 列
data[data.columns[1:]] 的 shape 就是 (10, 4)
而 data['指标'] 是一个 Series,它的 shape 是 (10,)
利用 np.matrix 这个方法,可以将指标列转换成矩阵,但这个矩阵的 shape 是 (1, 10)
将矩阵转置,shape 就变成 (10, 1),就可以和 data[data.columns[1:]] 比较了
2. 这里的 1 和 0 是传给 np.where 的第二和第三个参数
np.where 接收三个参数 condition, x , y
condition 是布尔型数组,x 是数组的元素为 True 时的取值,y 是数组的元素为 False 的取值
为了实现 Excel 里的 countif,只需让 x 为 1,y 为 0,然后再按行求和即可

其实不用 np.where 会更简单
  1. data['count_if'] = (data[data.columns[1:]] > np.matrix(data['指标']).T).sum(axis=1)
复制代码

可以得到同样的结果
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

 楼主| 发表于 2019-5-14 18:41:37 | 显示全部楼层
在东边 发表于 2019-5-14 15:03
1. 转置是为了让 data[data.columns[1:]] 和 指标列 可以比较
假设你的数据是 10 行 5 列
data[data.co ...

感谢热心帮忙~~
小甲鱼最新课程 -> https://ilovefishc.com
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

小黑屋|手机版|Archiver|鱼C工作室 ( 粤ICP备18085999号-1 | 粤公网安备 44051102000585号)

GMT+8, 2025-8-30 15:21

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表