R语言数据结构主要有以下四种:
四种数据结构,重点掌握 向量 和 数据框
判断数据结构的函数: class()
以下大部分操作使用的数据框为df
几个重要的函数:查看数据框的行数和列数,行名和列名;以及单独查行的数量,列的数量
数据框取子集有几种方法 : $ 符号,坐标,名字,逻辑值
在 [,] 里,行在前面(左边),列在后面(右边),行与列用逗号 , 隔开: [行,列]
中括号里的逗号,表示维度的分割
数据框按照逻辑值取子集,TRUE对应的行/列留下,FALSE对应的行/列去掉。
修改第二列的列名,就是修改列名这个向量的第二个元素
https://blog.csdn.net/weixin_39718006/article/details/110516670
后续的笔记会有详细介绍
矩阵不能用 $ 符号取子集
t():转置函数,行与列的互换
as.data.frame():转换,把矩阵变为数据框 ,用as.matrix()函数也能把数据框变为矩阵
聚类,相似的行,相似的列会聚在一起。热图自动聚类,行和列的相对位置发生了变化,只是列与列,行与行之间的变化规律。
![热图自动聚类]]( https://upload-images.jianshu.io/upload_images/17511166-f6e2432a04cffbbe.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240 )
热图默认聚类,修改参数,不让聚类,热图与表达矩阵对应。
默认的设置不符合自己的预期,可以子啊作者允许的范围内定义。
查看函数帮助文档,参考修改,达到自己的要求。
列表没有列名和行名,只有元素的名字。列表可以由数据框,矩阵,向量,单独的一个数字都可以组成。
列表没有行和列的概念,只有元素,取子集的两种方式: [[]] , $ ,
$ 有两个作用:数据框取子集和列表取子集。在矩阵和向量里不能用 $ 。
用 class() 函数更能具体说明问题, 判断数据结构和数据类型
以上内容是听 生信技能树 小洁老师的 R语言线上课 ,根据自己的理解记录下来,小洁老师授课非常细心,对不同水平的同学都照顾到,并且补充很多技巧以及注意事项。
认识R语言的四种数据结构,小洁老师强调重点掌握向量和数据框,在实战中遇到很多数据结构都是数据框,表达矩阵可以转化为数据框,数据框的一列可以看做是一个向量。小洁老师把实战中会需要的操作融入到练习题,在实战中能联想起小洁老师讲过的知识点。
rt<-read.table(file="c:\\data.txt")rownames(rt)<-rt[,1];
将数据框的第一列作为行名rt<-rt[,-1];
将数据框的第一列删除,只留下剩余的列作为数据head(rt);
扩展资料
R语言为数据框添加列名或行名
1、添加列名
wts=c(1,1,1)
names(wts)=c("setosa","versicolor","virginica")
2、为矩阵添加列名和行名
wts=matrix(0,3,4)row=c("row1","row2","row3")
column=c("setosa","versicolor","virginica")
dimnames(wts)=list(row,column)
1、首先打开电脑开始菜单,展开菜单并找到R文件夹,选择R x64 3.6.1。
2、在命令行,输入定义向量语句,然后赋值给x。
3、接着再定义一个向量,赋值给变量y,如下图所示。
4、使用相同的方法,再次定义一个向量z。
5、接着使用data.frame()方法,将x、y和z向量生成数据框w。
6、调用names()方法修改数据框w列名,分别改为第一列、第二列和第三列,如下图所示就完成了。