R语言分析各班学生成绩

Python015

R语言分析各班学生成绩,第1张

分析来自5各班的5位中学生的成绩情况,数据必须确保已保存在本地,名称为“scores.txt”

scores <- read.table("scores.txt",header=TRUE, row.names="num") #读取数据,并且默认读取的行名称就是已有的“num”中的数据,读取完成后,可以查看数据的前几行使用以下命令:

head(scores) #回车完成读取

summary(scores) #读取数据的概述

summary(scores$math) #可以获取所有的数学成绩,类似的,还可以获取语文、生物等成绩

child<- scores['573',] #预读取学号为“573”这位同学的全部信息

sum(child) #计算该学生的总成绩

aver <- tapply(chem,class,mean) #计算某班的某一科目的平均成绩

plot(aver,type='b',ylim=c(40,50),main="各班化学成绩平均分",xlab="班级",ylab="化学平均分") #其他成绩也是可以的,其中ylim是纵坐标的最大最小值区间。

subjects <- ('chn','math','eng','phy','chem','bio','politics','history','geo') #获取到所有科目的成绩;

sapply(scores[class==4,subjects],mean) #获取四班所有科目的平均成绩

aggregate (scores[subjects],by=list(class),mean) #按照科目对所有科目进行平均分的计算(每个班只有一组数据,所以结果和原始数据的大小是一样的)

hist(eng) #输出英语成绩的直方图

[1]https://www.cnblogs.com/speeding/p/4107768.html R语言学习笔记:分析学生的考试成绩

刚接触R语言一周,和matab不同R作用于数据挖掘的库很多,详解见 R语言数据挖掘包

,下面简介文本分析经常使用到的三个包

tm 为文本挖掘提供综合性处理 Rwordmsg 进行中文分词 wordcloud 统计词云

以第三届泰迪杯A题提供的数据集国美-Sheet1进行文本分析 : 第三届泰迪杯

转化为txt的数据集如下图所示:

生成词云:

R语言实用案例分析-相关系数的应用

在日常工作中,经常会存在多个变量之间存在关联关系,比如学习数学好的同学,物理成绩可能也比较高。在公司中外貌和讨人喜欢的关系往往也比较大,在人事招聘过程中,如果想要更加综合的评价某个人,需要把相关系数比较高的方面进行权重或者均值处理。

如以下案例:

现有30名应聘者来公司应聘,公司为这些应聘者制定了15项指标,分别是:求职信的形式(FL)、外貌(APP)、专业能力(AA)、讨人喜欢(LA)、自信心(SC)、洞察力(LC)、诚实(HON)、推销能力(SMS)、经验(EXP)、驾驶水平(DRV)、事业心(AMB)、理解能力(POT)、交际能力(KJ)和适应性(SUIT)。每项分数是从0到10分,0分最低,10分最高。每位求职者的15项指标如下所示,公司计划只录取前5名申请者,公司到底该如何选择呢?

#读入数据

rt<-read.table("applicant.data")

AVG<-apply(rt,1,mean)

sort(AVG,descreasing=TRUE)

attach(rt)

#找到相关系数高的分为一组,然后取平均值,防止值过大

rt$G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7

rt$G2<-(FL+EXP+SUIT)/3

rt$G3<-(LA+HON+KJ)/3

rt$G4<-AA

rt$G5<-APP

AVG<-apply(rt[,16:20], 1, mean)

sort(AVG, decreasing = TRUE)

找出前5名