安装pandas
pandas是构建在python编程语言之上的一个快速、强大、灵活且易于使用的开源数据分析和操作工具。pandas是基于numpy的专业数据分析工具,可以灵活高效的处理各种数据集。
我们使用pip进行安装(如果没有可自行查询如何安装pip)安装panda最简单的方法是将其作为anaconda的一部分安装,anaconda主要用于数据分析和科学计算。还提供源代码、pypi、activepython、各种linux发行版或开发版本进行安装的说明。
当然,最为基础的python环境还是少不了的,如果你是linux或使用的mac就不用安装python了。
pip install pandas
分析过程
1.从excel文件中读出本班同学的成绩册,并处理好缺失值。
2.根据‘加分'和‘减分'两列统计出平时成绩。
3.将实验报告成绩从abcd转换为百分制,统计出实验成绩。a为90分,b为75分,c为60分,d为40分。
4.随机生成假设的期末成绩,取值区间为40-100分。将自己的期末成绩改成你觉得可能考到的分数。
5.按照平时成绩20%,实验成绩30%,期末成绩50%的比例计算综合成绩。
6.输出你自己的平时成绩,实验成绩,期末成绩和综合成绩。
7.统计全班综合成绩[90,100],[80,89],[70,79],[60-69],[0,59]各段成绩的人数,并画饼图。
8.将完整的成绩保存到score.xlsx文件中,打开excel检查输出是否正确。
完整实例
准备工作:导入需要用到的模块
1
2
3
4
|
import pandas as pd import numpy as np import random from matplotlib import pyplot as plt |
(1)从excel文件中读出本班同学的成绩册,并处理好缺失值。
1
2
3
4
|
df = pd.read_csv( "4班平时成绩.csv" ,encoding = "gbk" ) df = df.rename(columns = { "id" : "学号" }) #将列名id重命名 df.set_index( "姓名" ,inplace = true) #将姓名作为index df = df.fillna(method = "backfill" ) #处理缺失值 |
(2)根据‘加分'和‘减分'两列统计出平时成绩。
1
2
|
df[ "平时成绩" ] = df[ "平时成绩" ] - df[ "减分" ] df = df.drop( "减分" ,axis = 1 ) #删除列 |
(3)将实验报告成绩从abcd转换为百分制,统计出实验成绩。a为90分,b为75分,c为60分,d为40分。
1
2
3
4
5
6
7
8
9
10
11
12
|
def m(x): #2 将abcd转化为对应的分数 if x = = "a" : return 90 if x = = "b" : return 75 if x = = "c" : return 60 if x = = "d" : return 40 df[ "第一次实验报告" ] = df.第一次实验报告. map (m) df[ "第二次实验报告" ] = df.第二次实验报告. map (m) df[ "第三次实验报告" ] = df.第三次实验报告. map (m) |
(4)随机生成假设的期末成绩,取值区间为40-100分。将自己的期末成绩改成你觉得可能考到的分数。
1
2
3
4
5
|
def cj(x): return random.randint( 40 , 100 ) df[ "期末成绩" ] = "" df[ "期末成绩" ] = df.期末成绩. map (cj) df |
(5)按照平时成绩20%,实验成绩30%,期末成绩50%的比例计算综合成绩。
1
2
3
|
df[ "综合成绩" ] = df[ "期末成绩" ] * 0.5 + df[ "平时成绩" ] * 0.2 + df[ "第一次实验报告" ] * 0.1 + \ df[ "第二次实验报告" ] * 0.1 + df[ "第三次实验报告" ] * 0.1 df |
(6)输出你自己的平时成绩,实验成绩,期末成绩和综合成绩。
1
|
df[df.姓名 = = '只为你220' ] |
(7)统计全班综合成绩[90,100],[80,89],[70,79],[60-69],[0,59]各段成绩的人数,并画饼图。
1
2
3
4
|
y = pd.cut(df[ '综合成绩' ],bins = [ 0 , 60 , 70 , 80 , 90 , 100 ],\ labels = [ '0-59' , '60-69' , '70-79' , '80-89' , '90-100' ]) #分区间 a = y.value_counts() #统计区间人数 print (a) |
1
2
|
plt.rcparams[ 'font.sans-serif' ] = [ 'simhei' ] a.plot(kind = 'pie' ,title = '学生成绩区间统计图' ) |
(8)将完整的成绩保存到score.xlsx文件中,打开excel检查输出是否正确。
将结果保存为.xlsx文件
1
|
df.to_excel(excel_writer = "score.xlsx" ,index = false,encoding = 'utf-8' ) |
将刚刚保存的.xlsx文件打开,查看结果是否正确
1
|
pd.read_excel( "score.xlsx" ) |
总结
到此这篇关于python利用pandas分析学生期末成绩码的文章就介绍到这了,更多相关pandas分析期末成绩内容请搜索服务器之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持服务器之家!
原文链接:https://blog.csdn.net/weixin_48906504/article/details/117931329