|
|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
本帖最后由 小生我怕怕 于 2014-6-13 11:41 编辑
题目:假设现在有一个文档1.txt,里面数据如下:
ID号 类型 次数 总数
1011 1 8 800
1011 2 10 1000
1011 3 20 500
1011 3 15 900
1112 1 8 800
1112 1 10 700
1012 2 8 675
1012 7 8 600
.......
现需要使用Python对文本数据做以下处理:
例如:对ID号1011的处理
1.计算每个1011的百分比(次数/总数),得出4个值,如:a,b,c,d
2.除2号类型外,取同ID下最高的百分比的数值,这里是c(20/500最高)
3.求出最终数值 log(b/c)这里是: log(0.01/0.04)=-0.6020
4.输入到同ID下新的一列中,输出效果:
ID号 类型 次数 总数 对数值
1011 1 8 800 -0.6020
1011 2 10 1000 -0.6020
1011 3 20 500 -0.6020
1011 3 15 900 -0.6020......
注意点:
1.ID号并不是连续的,同ID数量不固定,例如1218号ID可能有10个,也可能30个
2.类型号也不是连续的,每个同ID下,必有类型2
|
|