说说R语言的转置

Python020

说说R语言的转置,第1张

在群里看到了一个问题,他用R语言的转置函数 t() 对下面形式的数据进行了转置

转置之后的数据结构如下

他发现转置之后多了一行,也就是有了geneid这一行,和他预期的不符合。按照预期,geneid这一行应该是成为列名,而不是作为输出的第一行。那么,为什么会出现这个情况呢?这就需要从 t() 这个函数说起。

使用 ?t ,你会得到关于这个函数的函数说明。在函数的Detials部分中,有这样一段

即,数据框会先用 as.matrix() 转成矩阵格式,然后再引用 t() ,最终你对一个数据框使用 t() 函数时,你会得到一个矩阵,而非原先的data.frame.

举个例子:

因为矩阵要求存放的内容是同一种数据类型,对于输入的数据框而言,一般都会有字符串,数值这些,那么最终都会被转成字符串。

对于最开始的问题而言,因为原先的数据框的第一列是字符串,那么自然而然会把所有的数据都变成字符串,然后把第一列变成第一行。而如果要实现他真正的目的,需要先将第第一行变成行名,然后删掉第一行在转置,也就是

其结果就是先保证原来的数据框里面都是数值数据,而不是让第一列充当行名。

延伸一下,对于超过2维的数组,我们要用到 aperm 函数才能对数据进行转置。当然,超过二维的转置,你甚至都无法直观感受到这是一个什么过程。

#读取wet.txt需要转换的目标矩阵,显示原行列。本例中行为sample,列为otu

otu<-read.delim('E:\\R语言网络分析\\wet.txt',sep='\t',row.names=1)

otu1<-t(otu)

write.table(otu1,file='otu9.txt',sep='\t',row.names=T)

#读取wet.xlsx需要转换的目标矩阵,显示原行列。本例中行为sample,列为otu

library(openxlsx)

otu<-read_excel("E:\\R语言网络分析\\wet.xlsx")

otu1=t(otu)

##导出已转置文件到本地储存,此处导出的文件为Excel格式文件

write.xlsx(otu1,file="otu11.xlsx",sep='\t',row.names=T)

# 将otu1保存为csv文件

write.csv(otu1,file="otu11.csv")

library(openxlsx)

otu<-read_excel("E:\\R语言网络分析\\wet.xlsx")

head(otu)

class(otu)

otu1=t(otu)

write.xlsx(otu1,file="otu2.xlsx") ##导出已转置文件到本地储存,此处导出的文件为Excel格式文件

# 将otu1保存为csv文件

write.csv(otu1,file="otu5.csv")

R语言-数组到矩阵的转换

1、问题:

有一个很大的三维数组,需要转换为一个矩阵,是否能在R中用循环语句或者其他方式实现?

三维数组(3, 2, 3)类似下面形式:

, , 1

[,1] [,2]

[1,]14

[2,]25

[3,]36

, , 2

[,1] [,2]

[1,]7 10

[2,]8 11

[3,]9 12

, , 3

[,1] [,2]

[1,] 13 16

[2,] 14 17

[3,] 15 18

希望转换后的矩阵(6, 3)如下:

1713

41016

2814

51117

3915

61218

2、解答:

基于问题数据的特点,可直接用行组合就可以,避免使用循环计算,在进行大数据处理时可显著提高处理效率。

可以看到最终数据呈横向扩展,而与第3维数据的个数无关。

1、假定有数据:

>a <- array(1:18, dim=c(3,2,3))

>a

, , 1

[,1] [,2]

[1,]14

[2,]25

[3,]36

, , 2

[,1] [,2]

[1,]7 10

[2,]8 11

[3,]9 12

, , 3

[,1] [,2]

[1,] 13 16

[2,] 14 17

[3,] 15 18

2、合成后的矩阵为:

>b<- rbind(a[1,,],a[2,,],a[3,,])

一句话搞定。

3、查看结果

>b

[,1] [,2] [,3]

[1,]17 13

[2,]4 10 16

[3,]28 14

[4,]5 11 17

[5,]39 15

[6,]6 12 18

4、使用更多数据测试:

>a <- array(1:24, dim=c(3,2,4))

>a

, , 1

[,1] [,2]

[1,]14

[2,]25

[3,]36

, , 2

[,1] [,2]

[1,]7 10

[2,]8 11

[3,]9 12

, , 3

[,1] [,2]

[1,] 13 16

[2,] 14 17

[3,] 15 18

, , 4

[,1] [,2]

[1,] 19 22

[2,] 20 23

[3,] 21 24

>b<-rbind(a[1,,],a[2,,],a[3,,])

>b

[,1] [,2] [,3] [,4]

[1,]17 13 19

[2,]4 10 16 22

[3,]28 14 20

[4,]5 11 17 23

[5,]39 15 21

[6,]6 12 18 24

3、另外的方法

1、apply()

apply(x, 3, t)

apply()函数,可将一个任意函数“应用”到矩阵、数组、数据框的任何维度上。apply函数的使用格式为:

apply(x, MARGIN, FUN, ...)

其中,x为数据对象,MARGIN是维度的下标,FUN是由你指定的函数,而...则包括了任何想传递给FUN的参数。在矩阵或数据框中,MARGIN=1表示行,MARGIN=2表示列。

2、aperm()

(1)aperm() 函数,Transpose an array by permuting its dimensions and optionally resizingit.

Transpose变换顺序

permute 序列改变,重新排列一个数组

该函数意即改变数组的维度顺序,维度1,2,3按不同顺序进行变换。

(2)array()函数,用法array(data = NA, dim = length(data), dimnames = NULL)

array(aperm(x, c(2,1,3)), c(6,3))

将数组x维度改变(1->2,2->1,3->3)后:

aperm(x, c(2,1,3))

再变换成新的数组:

array(aperm(x, c(2,1,3)), c(6,3))

注意:

其实这样做有点多余,可直接应用数组变换:

array(x, c(6,3))

结果与上述方法结果一样。

如果是三维数量是4,则公式为:

array(x,c(6,4))

依此类推。