求python代码,统计保单号出现的第几次
【求助帖】请及时确认最佳答案,下次提问时可以得到更多关注,问题可以更快解决
保单号+ 个数 新单号
A13219013676 A13219013676
A13219013776 A13219013776
A13289259876 A13289259876
A13289259857 A13289259857
A13289259857 1 A13289259857-1
A13289259877 A13289259877
A13289259877 1 A13289259877 -1
A13289259877 2 A13289259877 -2
个数列如果只有单号唯一一个不显示,重复第一个不显示,重复的第二个显示1,重复的第三个的显示2,,最后添加新列,命名为新单号,保存到excel后个数列,这么显示 你怎么老是问同一个问题? isdkz 发表于 2023-5-22 14:10
你怎么老是问同一个问题?
last_data['单号'] = np.where(last_data['个数']==0,last_data['保单号+'],last_data['保单号+']+"-"+str(last_data['个数']))
把的填完,我继续完善功能,新加单号,保存到excel中就显示一堆,不是想要的,提示<class 'pandas.core.series.Series'> 冰菲 发表于 2023-5-22 14:15
last_data['单号'] = np.where(last_data['个数']==0,last_data['保单号+'],last_data['保单号+']+"-"+st ...
你想要的新列"新单号",需要对每一行进行操作,所以我们需要使用 apply() 函数来对每一行进行操作。以下是修改后的代码:
import pandas as pd
# 读取Excel文件
df = pd.read_excel('input.xlsx')
# 创建一个字典来跟踪每个保单号的出现次数
count_dict = {}
# 创建一个新列来保存出现的次数
df['个数'] = 0
for i in range(len(df)):
policy_number = df.loc
if policy_number in count_dict:
count_dict += 1
df.loc = count_dict
else:
count_dict = 0
# 添加新单号列
df['新单号'] = df.apply(lambda row: row['保单号+'] if row['个数']==0 else row['保单号+'] + "-" + str(row['个数']), axis=1)
# 保存到新的Excel文件中
df.to_excel('output.xlsx', index=False)
这段代码将对每一行应用一个函数,该函数会检查"个数"列是否为0。如果为0,它将只使用"保单号+"的值,否则,它将在"保单号+"的值后添加一个连字符和"个数"的值。
isdkz 发表于 2023-5-22 14:22
你想要的新列"新单号",需要对每一行进行操作,所以我们需要使用 apply() 函数来对每一行进行操作。以 ...
太棒了,感谢!!!,理解能力真强,我还怕我没介绍清楚呢 冰菲 发表于 2023-5-22 14:26
太棒了,感谢!!!,理解能力真强,我还怕我没介绍清楚呢
不客气,是chatgpt的理解能力强{:5_97:} isdkz 发表于 2023-5-22 14:27
不客气,是chatgpt的理解能力强
我只会写简单的代码,你的代码逻辑我都不懂{:5_109:},能跑就行了
页:
[1]