install.packages("xlsx")
选择China的任意一个镜像站点,它会自动安装其他所需的依赖包
安装好xlsx包后,接下来导入存放在“C:\Users\HWT\Desktop”路径下的“test.xlsx”文件,导入这个文件的代码如下:
library(xlsx)
read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)
我们上面的代码只是把test.xlsx导入了R语言,并没有把它赋给R语言里的某个对象,用下面的代码把数据赋给对象Mydata:
Mydata<-read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)
那么如何查看Mydata里面的数据呢?只需要输入“Mydata”即可:
接下来教大家导入xls格式的数据,其实这个很简单,只要把前面代码的xlsx改为xls就可以了:
read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xls",sheetIndex=1)
在R语言里面,有很多读取数据的方法。R能读文本文件,csv格式文件,通过RODBC包读取数据库数据等等。下面我介绍几种最基本的读取数据的方法!工具/原料
RStudio
方法
不管是读取数据还是写入,R都是在工作路径中完成的。所以首先我们要知道我们的R所在的工作路径是在哪里。使用getwd()函数来获取我们的工作路径。
下面查看工作路径里面有哪些文件,使用dir()函数
如果你所想导入的数据并不在你当前的工作路径中,有两种方法可以解决。第一种就是把数据文件放到工作路径中,第二种方法就是更改工作路径。更改工作路径使用setwd()函数。比如你想要把工作路径设置成桌面
现在我读取我工作路径中,名字为hw1_data.csv的文件。使用read.csv()函数
也可以使用read.table()函数来读取csv格式的文件。由于csv文件的分隔符是“,”所以我们在用read.table()函数的时候,sep参数,我们要设定为sep=“,”
发现read.table()读出来的数据,列名并不是我们文件中的列名,而是V1,V2。。。我们需要加上header这个参数来修改这个问题
另外在read.table()函数族中还有很多参数,对我们读取数据都有帮助,大家可以去了解下。使用?read.table()进行了解
qiime2会直接给出各个分类水平的丰度表,用R语言也可以从otu表中抽提出各个水平的丰度表。读取otu丰富度
代码思路:
1 strsplit后,phylum不是na也不是""则记下,否则记行数到delete
2 添加phylum列,删除注释列和记到delete的phylum
3 按Phylum排序,获取Phylum unique列表
4提取第一个phylum所有行到新表,apply列求和
5遍历剩下的phylum列表,提取每个phylum,apply按列求和,添加到新表
6 数据归一化,保存
拓展:
R语言读取Excel文件的各种方法
最近初学R语言,在R语言读入EXCEL数据格式文件的问题上遇到了困难,经过在网上搜索解决了这一问题,下面归纳几种方法,供大家分享:
第一: R中读取excel文件中的数据的路径:
假定在您的电脑有一个 excel 文件,原始的文件路径是: D:workdata1
如果直接把这个路径拷贝到R中,就会出现错误,原因是:
是escape character(转义符),\才是真正的字符,或者用/
因此,在R中有两种方法读取该路径:
1:在R中输入一下路径: D:\work\data\1 2:在R中输入一下路径: D:\work\data\1 第二: R中读取excel文件中的数据的方法 :
read.table(),read.csv(),read.delim()直接读取EXCEl文件时,都会遇到一下问题:“在读取‘.xls’的TableHeader时遇到不完全的最后一行”。解决的方法有以下几种:假如文件1.1中是一个6乘以2的矩阵,元素为:
方法1: xls另存为csv格式然后用read.csv :
具体过程如下:
>data<-read.csv("D:\work\data\1.csv") >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 >data<-read.csv("D:\work\data\1.csv",header = F) >data V1 V2 1 1 23333 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 >data<-read.csv("D:\work\data\1.csv",header = T) >data X1 X23333 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 也就是说 header = T(TURE)是默认的状态 ,在这默认状态下,输出的data矩阵是一个5乘以2的矩阵,第一行作为了data的名字,如果 header = F(FALSE), 则会现实原始的矩阵结果。
方法2: xls另存为txt格式然后用read.table : 如例子所示:
>data<-read.table("D:\work\data\1.txt",header = T) >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28
>data<-read.table("D:\work\data\1.txt",header = F) >data V1 V2 1 1 23 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 方法3:打开EXCEL,全选里面的内容,点击复制,然后在R中输入一下命令:数据分析培训
data <- read.table("clipboard", header = T, sep = 't') 结果如下所示:
>data <- read.table("clipboard", header = T, sep = 't') >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 >data <- read.table("clipboard", header = F, sep = 't') >data V1 V2 1 1 23 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 使用这种方法的时候一定要注意复制!剪切板里面没有内容是无法运行的!