R语言对应分析

Python011

R语言对应分析,第1张

@[toc]

Q型分析:样本之间的关系(聚类算法等)

R型分析:变量之间的关系(主成分分析、因子分析等)。

有时候我们不仅要弄清样本之间和变量之间的关系,还要弄清 样本与变量之间的关系 ,而对应分析就是这样一种分析方法。(变量就是指特征)

对应分析为我们可以提供三个方面的信息

上述三方面信息都可以通过二维图呈现出来

当对两个分类变量进行的对应分析称为 简单对应分析

对两个以上的分类变量进行的对应分析称为 多重对应分析

对应分析将变量及变量之间的联系同时反映在一张二维或三维的散点图上,并使联系密切的类别点较集中,联系疏远的类别点较分散;通过观察对应分布图就能直观地把握变量类别之间的联系。

对于该方法,在减少维度方面与因子分析相似,在作分布图方面与多维尺度方法相似。

在对数据作对应分析之前,需要先了解因素间是否独立。如果因素之间相互独立,则没有必要进行对应分析,当因素间在统计学上具有显著的关联性时,在此基础上使用对应分析方法,其分析结果才具有意义。

p-value <0.001,两组变量显著不独立,说明具有相关性。

我们在临床做回顾性研究分析中经常要面对数据缺失的问题,如果数据缺失量大就会对我们的研究结果产生影响,近年来,对数据进行多重插补广泛应用于SCI论文中。我们在之前的文章中已经演示了使用SPSS对数据进行多重插补并分析。今天,我们通过使用R语言的Mice包来演示多重插补并对数据进行分析。

我们使用R语言survival包自带的mgus数据集来进行演示

先把数据导入

library(survival)

library(rms)

data(package=“survival”)

data(“mgus”)

head(mgus)

bc<-mgus

与T检验相似,ANOVA同样要求数据服从正态分布;此外,ANOVA还建立在各组方差相等的基础上。因此,在执行单因素ANOVA之前,我们首先应当对数据进行正态性分布验证,以及方差齐性检验。