R语言对应分析

Python059

R语言对应分析,第1张

@[toc]

Q型分析:样本之间的关系(聚类算法等)

R型分析:变量之间的关系(主成分分析、因子分析等)。

有时候我们不仅要弄清样本之间和变量之间的关系,还要弄清 样本与变量之间的关系 ,而对应分析就是这样一种分析方法。(变量就是指特征)

对应分析为我们可以提供三个方面的信息

上述三方面信息都可以通过二维图呈现出来

当对两个分类变量进行的对应分析称为 简单对应分析

对两个以上的分类变量进行的对应分析称为 多重对应分析

对应分析将变量及变量之间的联系同时反映在一张二维或三维的散点图上,并使联系密切的类别点较集中,联系疏远的类别点较分散;通过观察对应分布图就能直观地把握变量类别之间的联系。

对于该方法,在减少维度方面与因子分析相似,在作分布图方面与多维尺度方法相似。

在对数据作对应分析之前,需要先了解因素间是否独立。如果因素之间相互独立,则没有必要进行对应分析,当因素间在统计学上具有显著的关联性时,在此基础上使用对应分析方法,其分析结果才具有意义。

p-value <0.001,两组变量显著不独立,说明具有相关性。

变量为我们提供了程序可以操作的命名存储, R语言中的变量可以存储原子向量,原子向量组或许多Robject的组合。有效的变量名称由字母,数字和点或下划线字符组成。变量名以字母或不以数字后跟的点开头。

变量赋值

可以使用向左,向右和等于运算符来为变量分配值。可以使用print()或cat()函数打印变量的值。cat()函数将多个项目组合成连续打印输出。

var.1 = c(0,1,2,3)

var.2 <- c("learn","R")

c(TRUE,1) ->var.3

print(var.1)

cat("var.1 is",var.1,"")

cat("var.2 is",var.2,"")

cat("var.3 is",var.3,"")

[1] 0 1 2 3

var.1 is 0 1 2 3

var.2 is learn R

var.3 is 1 1

注:向量c(TRUE,1)具有逻辑和数值类的混合,因此,逻辑类强制转换为数字类,使TRUE为1。