library(ade4)
library(ggplot2)
library(RColorBrewer)
library(vegan)
这里我们使用R自带得数据iris
data(iris)
在R语言中通常都会使用这个数据进行案例分析
#iris
data(iris)
iris
data01<-iris[,-5]#数据预处理,去掉最后一列得数据标签
data01
dis01<-vegdist(data01,method = "euclidean")#这里是为了算矩阵距离,方法根据数据选择合适得方法
dis01
pcoa1<- dudi.pco(dis01, scan = FALSE,nf=3)#进行PCoA分析
pcoa1
pcoa1_eig<-pcoa1$eig[1:2]/sum(pcoa1$eig)#算一下前两列对整个数据得解释比例
pcoa1_eig
samplesite1<-data.frame({pcoa1$li})[1:2]#将前两列的数据分析结果放到sample_site1里面
sample_site1
sample_site1$names<-rownames(sample_site1)#设置名称
sample_site1$names
iris$Species
sample_site1$level<-factor(iris$Species,levels = c("setosa","versicolor","virginica"))#设置level的标签
sample_site1$level
names(sample_site1)[1:2]<-c("PCoA1","PCoA2")
p<-ggplot(sample_site1, mapping=aes(PCoA1, PCoA2,color=level))+theme_classic()
p<-p+geom_point()#绘制散点图
p
R语言实用案例分析-相关系数的应用在日常工作中,经常会存在多个变量之间存在关联关系,比如学习数学好的同学,物理成绩可能也比较高。在公司中外貌和讨人喜欢的关系往往也比较大,在人事招聘过程中,如果想要更加综合的评价某个人,需要把相关系数比较高的方面进行权重或者均值处理。
如以下案例:
现有30名应聘者来公司应聘,公司为这些应聘者制定了15项指标,分别是:求职信的形式(FL)、外貌(APP)、专业能力(AA)、讨人喜欢(LA)、自信心(SC)、洞察力(LC)、诚实(HON)、推销能力(SMS)、经验(EXP)、驾驶水平(DRV)、事业心(AMB)、理解能力(POT)、交际能力(KJ)和适应性(SUIT)。每项分数是从0到10分,0分最低,10分最高。每位求职者的15项指标如下所示,公司计划只录取前5名申请者,公司到底该如何选择呢?
#读入数据
rt<-read.table("applicant.data")
AVG<-apply(rt,1,mean)
sort(AVG,descreasing=TRUE)
attach(rt)
#找到相关系数高的分为一组,然后取平均值,防止值过大
rt$G1<-(SC+LC+SMS+DRV+AMB+GSP+POT)/7
rt$G2<-(FL+EXP+SUIT)/3
rt$G3<-(LA+HON+KJ)/3
rt$G4<-AA
rt$G5<-APP
AVG<-apply(rt[,16:20], 1, mean)
sort(AVG, decreasing = TRUE)
找出前5名