如何用r语言读取xlsx文件中一列的数据

2023-02-24 23:10:02Python014

如何用r语言读取xlsx文件中一列的数据,第1张

首先，导入R语言需要加载xlsx包，没有安装这个包的，请用下面的代码进行在线安装：

install.packages("xlsx")

选择China的任意一个镜像站点，它会自动安装其他所需的依赖包

安装好xlsx包后，接下来导入存放在“C:\Users\HWT\Desktop”路径下的“test.xlsx”文件，导入这个文件的代码如下：

library(xlsx)

read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)

我们上面的代码只是把test.xlsx导入了R语言，并没有把它赋给R语言里的某个对象，用下面的代码把数据赋给对象Mydata:

Mydata<-read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xlsx",sheetIndex=1)

那么如何查看Mydata里面的数据呢？只需要输入“Mydata”即可：

接下来教大家导入xls格式的数据，其实这个很简单，只要把前面代码的xlsx改为xls就可以了：

read.xlsx2(file="C:\\Users\\HWT\\Desktop\\test.xls",sheetIndex=1)

在R语言里面，有很多读取数据的方法。R能读文本文件，csv格式文件，通过RODBC包读取数据库数据等等。下面我介绍几种最基本的读取数据的方法！

工具/原料

RStudio

方法

不管是读取数据还是写入，R都是在工作路径中完成的。所以首先我们要知道我们的R所在的工作路径是在哪里。使用getwd()函数来获取我们的工作路径。

下面查看工作路径里面有哪些文件，使用dir()函数

如果你所想导入的数据并不在你当前的工作路径中，有两种方法可以解决。第一种就是把数据文件放到工作路径中，第二种方法就是更改工作路径。更改工作路径使用setwd()函数。比如你想要把工作路径设置成桌面

现在我读取我工作路径中，名字为hw1_data.csv的文件。使用read.csv()函数

也可以使用read.table()函数来读取csv格式的文件。由于csv文件的分隔符是“，”所以我们在用read.table()函数的时候，sep参数，我们要设定为sep=“，”

发现read.table()读出来的数据，列名并不是我们文件中的列名，而是V1，V2。。。我们需要加上header这个参数来修改这个问题

另外在read.table()函数族中还有很多参数，对我们读取数据都有帮助，大家可以去了解下。使用？read.table()进行了解

qiime2会直接给出各个分类水平的丰度表，用R语言也可以从otu表中抽提出各个水平的丰度表。

读取otu丰富度

代码思路：

1 strsplit后，phylum不是na也不是""则记下，否则记行数到delete

2 添加phylum列，删除注释列和记到delete的phylum

3 按Phylum排序，获取Phylum unique列表

4提取第一个phylum所有行到新表，apply列求和

5遍历剩下的phylum列表，提取每个phylum，apply按列求和，添加到新表

6 数据归一化，保存

拓展:

R语言读取Excel文件的各种方法

最近初学R语言，在R语言读入EXCEL数据格式文件的问题上遇到了困难，经过在网上搜索解决了这一问题，下面归纳几种方法，供大家分享：

第一： R中读取excel文件中的数据的路径：

假定在您的电脑有一个 excel 文件，原始的文件路径是： D:workdata1

如果直接把这个路径拷贝到R中，就会出现错误，原因是：

是escape character（转义符），\才是真正的字符，或者用/

因此，在R中有两种方法读取该路径：

1：在R中输入一下路径： D:\work\data\1 2：在R中输入一下路径： D:\work\data\1 第二： R中读取excel文件中的数据的方法：

read.table(),read.csv(),read.delim()直接读取EXCEl文件时，都会遇到一下问题：“在读取‘.xls’的TableHeader时遇到不完全的最后一行”。解决的方法有以下几种：假如文件1.1中是一个6乘以2的矩阵，元素为：

方法1： xls另存为csv格式然后用read.csv ：

具体过程如下：

>data<-read.csv("D:\work\data\1.csv") >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 >data<-read.csv("D:\work\data\1.csv",header = F) >data V1 V2 1 1 23333 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 >data<-read.csv("D:\work\data\1.csv",header = T) >data X1 X23333 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 也就是说 header = T（TURE）是默认的状态，在这默认状态下，输出的data矩阵是一个5乘以2的矩阵，第一行作为了data的名字，如果 header = F（FALSE），则会现实原始的矩阵结果。

方法2： xls另存为txt格式然后用read.table ：如例子所示：

>data<-read.table("D:\work\data\1.txt",header = T) >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28

>data<-read.table("D:\work\data\1.txt",header = F) >data V1 V2 1 1 23 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 方法3：打开EXCEL，全选里面的内容，点击复制，然后在R中输入一下命令：数据分析培训

data <- read.table("clipboard", header = T, sep = 't') 结果如下所示：

>data <- read.table("clipboard", header = T, sep = 't') >data X1 X23 1 2 24 2 3 25 3 4 26 4 5 27 5 6 28 >data <- read.table("clipboard", header = F, sep = 't') >data V1 V2 1 1 23 2 2 24 3 3 25 4 4 26 5 5 27 6 6 28 使用这种方法的时候一定要注意复制！剪切板里面没有内容是无法运行的！

路径数据文件方法语言

# 上一篇：Python中子类怎样调用父类方法

# 下一篇：零基础学java要多久