R语言变量的定义

Python011

R语言变量的定义,第1张

R中有许多用于存储数据的结构,包括标量、向量、数组、数据框和列表。多样化的数据结构赋予了R极其灵活的数据处理能力。R可以处理的数据类型包括数值型、字符型、逻辑型(TRUE/FALSE)、复数型(虚数)和原生型(字节)。数据框(data frame)是R中用于存储数据的一种结构:列表示变量,行表示观测。在同一个数据框中可以存储不同类型(如数值型、字符型)的变量。数据框将是你用来存储数据集的主要数据结构。因子(factor)是名义型变量或有序型变量。它们在R中被特殊地存储和处理。

class()函数可以查询变量的抽象类型,typeof()函数可以查询变量在内存中保存的方式,is.integer() 函数可以判断数据是否为整型,这个函数同样可以判断其他的数据类型,as.integer() 函数可以将数据强制转换为整型,其它数据类型也适用,length() 函数可以返回变量的长度。

1、数值型(numerical)变量

在控制台中键入下列命令建立数值型变量并查看变量类型:

2、字符型(character)变量

在控制台中键入下列命令建立字符型型变量并打印:

3、逻辑型(logical)变量

在控制台中键入下列命令建立逻辑性变量并查看变量类型:

4、复合型(complex)变量

R中的复合型变量指数学上的复数,包括实部和虚部,定义如下:

比如 Horticulture Research 中的论文 Comparative analysis of long noncoding RNAs in angiosperms and characterization of long noncoding RNAs in response to heat stress in Chinese cabbage 方法部分写道

这里相当于是计算两个数据集中的变量之间的相关性,之前发现 correlation 这个R包里的函数 correlation() 可以做

但是这里遇到了一个问题

关掉这个报错界面以后就会提示

暂时还不知道如何解决,自己搜索了一下暂时还没有找到解决办法

只能把输入法切换成中文,然后一次性把函数名输入完

计算相关系数和P值

结果如下

但是mRNA的表达量有上万个,用这个函数计算的时候是非常慢的

找到了另外一个函数是 Hmisc 这个包中的 rcorr() 函数

这个速度快很多,但是他不能计算两个数据集之间变量的相关性,

这样的话可以先计算,然后再筛选

这个函数要求的输入数据是矩阵格式

自定义函数将这个结果转换成一个四列的数据框格式

最后用变量名去匹配

两个矩阵之间的相关性热图这么容易画的吗?零基础学习R语言之相关性分析2_哔哩哔哩_bilibili

psych 这个包里的 corr.test() 函数也是可以直接计算两个数据集变量之间的相关性的,这个结果了也有显著性检验的p值

但是这个如果数量量比较大的话速度也很慢

小明的数据分析笔记本