R语言 怎么计算两个不是数值的数据(比如星座与血型)的相关系数

Python018

R语言 怎么计算两个不是数值的数据(比如星座与血型)的相关系数,第1张

你可以把星座和血型分别用数值去代替,然后用R语言中的cor(x,y,method = c("pearson", "kendall", "spearman")来计算,一般不能用pearson,这种方法适用于连续数据,后两种都可以提供相关程度的一定的参考。

击表格中任何一个有数据的单元格,也就是选中数据清单,然后打开“数据”菜单,选择“排序”,在弹出的对话框中,设置“主要关键字”即可。

连续型数据的的分组比较在科研生活中非常常见,比如:实验组和对照组基因表达量的比较、临床病人存活组和死亡组某项检查指标的比较 等等。检验两组连续型数据之间是否存在差异通常会使用T检验。对数据进行展示通常可以使用柱形图,箱线图,小提琴图,直方图,散点图等几种方式。

r语言中等于号是用作赋值的功能。R语言最开始设计的时候,是采用箭头(<-)作为赋值符号的,这是从APL语言继承而来的(箭头表示赋值,等号表示判断)。之后的S语言也沿用了这个用法,再之后R语言为了保持和S语言的兼容性保留了这个箭头。直到2001年,R的更新版本中 才加入了等号(=)赋值。因此,对于一般的赋值语句,箭头(<-)与 等号(=)在 功能上是没有区别的,可以通用。但是等号(=)的作用有两个:它既可以赋值,也可以传递函数参数(实际上传参可以看作一种特殊形式的赋值,给参数赋值)。通常情况下,如果等号(=)出现在单独的环境中,它就是赋值;如果写在函数的参数位置,它就是传参。如果你在设置参数的时候使用了箭头(<-),那么你会发现在全局变量里,会多出一个和参数名相同的赋值的变量,容易导致歧义和错误,而且占用命名空间。