|
10鱼币
本帖最后由 lzymm1 于 2021-4-19 13:28 编辑
如题,如何将def函数运用到这段代码里面运行?
我之前想做一个排名统计的程序,参考了一段鱼友的代码做出如下的程序,但是不会把def函数代入其中。
程序要处理的是类似这样的一张普通登分表,然后输出一张有各科排名和九科总分、三科总分还有每个科目单独的排名sheet:
(鱼友的代码只能识别只有九科的登分表,然后我想灵活一点,多少科都能处理,做好了结果不会代入def函数emmm,因为没学过。于是想来求助一下)
考号 | 班别 | 姓名 | 语文 | 数学 | 外语 | 物理 | 化学 | 生物 | 历史 | 政治 | 地理 | 1 | 高二(1)班 | 梁 | 46 | 45 | 75 | 98 | 76 | 54 | 32 | 43 | 54 | 2 | 高二(2)班 | 张 | 13 | 35 | 65 | 12 | 57 | 86 | 45 | 23 | 86 | 3 | 高二(3)班 | 李 | 12 | 80 | 57 | 68 | 45 | 76 | 79 | 67 | 68 | 4 | 高二(4)班 | 吴 | 12 | 23 | 24 | 67 | 34 | 4 | 45 | 56 | 57 | 5 | 高二(5)班 | 秦 | 54 | 23 | 56 | 86 | 56 | 75 | 45 | 34 | 57 | 6 | 高二(6)班 | 张 | 75 | 68 | 45 | 34 | 23 | 54 | 34 | 21 | 24 | 7 | 高二(7)班 | 魏 | 67 | 89 | 0 | 90 | 43 | 98 | 78 | 67 | 33 | 8 | 高二(8)班 | 瑾 | 67 | 79 | 8 | 66 | 68 | 56 | 45 | 34 | 56 | 这是我的代码:# coding=utf-8
import pandas as pd
#识别登分表中含有的科目
data = pd.read_excel(r'D:\Desktop\登分表.xls', index_col=0)
columns = list(data.columns)
subjects_list = ['语文','数学','英语','日语','外语','物理','化学','地理','生物','政治','历史']
subjects = [i for i in columns if i in subjects_list]
language_list = ['英语', '外语', '日语']
language = [i for i in columns if i in language_list]
Main_subjects = ['语文', '数学']
#添加每一科的排名
Personal_Information = columns.index(subjects[0])
sequence = []
for i in subjects:
data[i + '排名'] = data[i].rank(method='min', ascending=False)
sequence.append(i)
sequence.append(i+'排名')
#检测是否含有主三科,如果有,计算三科总分。
if (Main_subjects + language) < subjects:
Include = 'Yes'
data['三科总分'] = data['语文'] + data['数学'] + data[language[0]]
data['三科总分排名'] = data['三科总分'].rank(method = 'min',ascending = False)
#计算所有科目总分,生成排名。
data[str(len(subjects)) + '科总分'] = data.loc[:, subjects[0]:subjects[len(subjects)-1]].sum(axis=1)
data[str(len(subjects)) + '科总分名次'] = data[str(len(subjects)) +'科总分'].rank(method='min', ascending=False)
data.sort_values(by=str(len(subjects)) + "科总分名次", inplace=True)
#整理顺序
if Include == 'Yes':
Add = ['三科总分', '三科总分排名', str(len(subjects)) + '科总分',str(len(subjects)) + '科总分名次']
else:
Add = [str(len(subjects)) + '科总分', str(len(subjects)) + '科总分名次']
All = list(set(columns) - set(subjects)) + sequence + Add
data = data.loc[:, All]
#新增已有科目的单科排名sheet
with pd.ExcelWriter(r'D:\Desktop\成绩统计.xls') as writer:
data.to_excel(writer, sheet_name='所有科目')
for i in subjects:
rank = i + '排名'
PI_list = list(set(columns) - set(subjects))
PI_list2 = PI_list
PI_list2.append(i)
PI_list2.append(rank)
single_subject_ranking = data.loc[:,PI_list2 ]
single_subject_ranking.sort_values(by=rank, inplace=True)
single_subject_ranking.to_excel(writer,sheet_name=rank)
PI_list2.clear()
这是鱼友的代码:# coding=utf-8
import pandas as pd
import easygui as g
import sys
#选择原文件路径
def get_file():
confirm = g.ccbox(msg="程序简介 & 注意事项: \n\n 1.本程序可以根据Excel登分表一键生成九科总分排名以及单科排名。选择或保存文件时, 左上角会有提示,请注意左上角小标题。\n2.本程序设计初衷是为了分担老师们的排名统计工作,未经允许严禁用于商用。\n\n\n ⚬ 注意事项:登分表内必须有且仅有\n ‘考号’‘班别’‘姓名’‘语文’‘数学’‘外语’\n ‘物理’‘历史’‘生物’‘地理’‘政治’‘化学’。\n 但无需按照顺序排列,本程序会自动排序。\n\n\n\n 准备好后请单击“下一步”",
title='学生成绩统计程序', choices=('下一步', '退出'))
if confirm == True:
file = g.fileopenbox(msg='', title='请选择登分表Excel文件',
default=r'C:\\', filetypes=['*.xlsx'])
if file == None or file == '.':
sys.exit()
else:
return file
else:
sys.exit()
#得到所有科目
def get_subject(data):
km = ['语文', '数学', '外语', '物理', '化学', '生物', '政治', '历史', '地理']
all_subject = []
for subject in data.columns:
if subject in km:
all_subject.append(subject)
return all_subject
#猎取单科数据 ID + 班别 + 姓名 + 本科目的成绩 + 排名
def get_series(kem, orig, savep):
with pd.ExcelWriter(savep) as writer:
orig.to_excel(writer, sheet_name='所有科目')
for i in kem:
pm = i + '名次'
df_dk = orig.loc[:, ['班别', '姓名', i, pm]]
df_dk.sort_values(by=pm, inplace=True)
df_dk.to_excel(writer, sheet_name=i)
def edit_all(data1):
for kemu in data1.columns[2:]:
data1[kemu+'名次'] = data1[kemu].rank(method='min', ascending=False)
data1['3科总分'] = data1['语文'] + data1['数学'] + data1['外语']
data1['3科总分名次'] = data1['3科总分'].rank(method='min', ascending=False)
data1['9科总分'] = data1.loc[:, '语文':'地理'].sum(axis=1)
data1['9科总分名次'] = data1['9科总分'].rank(method='min', ascending=False)
data1.sort_values(by="9科总分名次", inplace=True)
data2 = data1.loc[:, ['班别', '姓名', '语文', '语文名次', '数学', '数学名次',
'外语', '外语名次', '物理', '物理名次', '化学', '化学名次',
'生物', '生物名次', '政治', '政治名次', '历史', '历史名次',
'地理', '地理名次', '3科总分', '3科总分名次', '9科总分', '9科总分名次']]
return data2
excel_file = get_file()
df1 = pd.read_excel(excel_file, index_col=0)
df2 = edit_all(df1)
allkm = get_subject(df1)
sp = g.filesavebox(msg='请选择保存路径及输入保存文件名(注:默认为“成绩统计表”。不需要写后缀).',
title='学生成绩统计程序', default=r'成绩统计表', filetypes=['*.xlsx'])
spp = sp + '.xlsx'
get_series(allkm, df2, spp)
g.msgbox("文件保存成功,感谢您的使用!\n\n\n\n\n\n 更多功能正在开发中....\n\n 作者:xxx\n\n\n 版本号:2020/12/23", '学生成绩统计程序')
该怎样改写呢?能请你帮助我一下吗?
|
|