|
马上注册,结交更多好友,享用更多功能^_^
您需要 登录 才可以下载或查看,没有账号?立即注册
x
需要把一个二维数组的值 按照某个规则,新建字段
所有数组的值都是1-5之间的值 下面是例子数据
id,A5,A10
1,5,3
2,1,4
3,2,4
4,3,4
规则就是 A5,A10下的数值,1-2 转成 'lev1',3转成'lev2', 4-5 转成‘lev3’
下面就是转换成的样子
id,A5,A10,new_A5,new_A10
1,5,3,lev3,lev2
2,1,4,lev1,lev3
3,2,4,lev1,lev3
4,3,4,lev2,lev3
我定义的函数是下面
data是原始数据
de_data=['A5','A10']
def def_jar(de_data):
data_list=[]
data_list=data.ix[:,de_data]
for var_i in de_data:
while data_list[var_i]==3:
data['new_%s'%var_i]='lev1'
if data_list[var_i]<=2:
data['new_%s'%var_i]='lev2'
else :
data['new_%s'%var_i]='lev13'
结果报错
Traceback (most recent call last):
File "F:\工作\panda.py", line 27, in <module>
def_jar(de_data)
File "F:\工作\panda.py", line 19, in def_jar
while data_list[var_i]==3:
File "C:\Program Files\Python35\lib\site-packages\pandas\core\generic.py", line 917, in __nonzero__
.format(self.__class__.__name__))
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().
- def modify(file):
- f=open(file)
- nvalue=[]
- for each_line in f:
- if each_line.find('id') !=-1:
- each_line=each_line[:-1]
- temp=each_line.split(',')
- temp.append('new_'+temp[1])
- temp.append('new_' + temp[2]+'\n')
- nvalue.append(temp)
- else:
- if each_line.find('\n')!=-1:
- each_line = each_line[:-1]
- temp = each_line.split(',')
- if temp[1]<'3':
- temp.append('lev1')
- elif temp[1] =='3':
- temp.append('lev2')
- else:
- temp.append('lev3')
- if temp[2]<'3':
- temp.append('lev1\n')
- elif temp[2] =='3':
- temp.append('lev2\n')
- else:
- temp.append('lev3\n')
- nvalue.append(temp)
- f.close()
- newf=open('new_'+file,'w')
- for each_newline in nvalue:
- newf.writelines(','.join(each_newline))
- newf.close()
- filename=input('请输入文件名:')
- modify(filename)
复制代码
|
|