【数据分析与挖掘】R语言矩阵Matrix与数组Array

Python015

【数据分析与挖掘】R语言矩阵Matrix与数组Array,第1张

之前我们讲了向量,向量就仿佛一个一维数组一样

那么我们接下来就讲讲二维数组

创建一个matrix需要用到matrix函数

martix(参数1,nrow=行数,ncol=列数,byrow=布尔值)

参数1:matrix初始化的值,如果给出的值不够matrix长度将重复赋值,如果给出的值溢出将会报错。

参数byrow:这是一个布尔值如果给定TRUE,初始数据按行顺序推进,反之按列顺序推进。

这里说一下R语言中 ' . ' 并没有特殊的意义,只是变量名的一部分

读取矩阵我们用到:矩阵名[行,列]

这里的行和列可以接收单个数组也可以接收一个向量

当然如果是负数和向量一样就是排除掉对应索引指向的值

test.m[2, ]    #取第二行,我们注意这里把列的地方空出来就是显示所有列

test.m[ ,2]     #取第二列

test.m[2,2]    #取第二行第二个

我们也可以给索引一个向量 比如3:4或者c(1,4)之类的,如上图所示,索引值也可以不连续

我们知道在二维表中 我们通常给每一行每一列取一个名字

矩阵中我们也可以这样做

首先我们给每一行每一列取一个名字,用向量保存

之后我们使用rownames(矩阵名)<-存有名字的向量给每行取名,给列取名同理见上图

取名之后我们可以用名称代替下标访问,例如:test.m['2nd','二']

看到这里,我真的觉得数据分析相关专业十分的艰难,需要用一些稀奇古怪的东西来进行数据分析

因为本人是计科专业的,平时用的数组就是单纯的数组,R语言的数组我一开始是令我怀疑人生的。

创建一个数组我们需要用到array函数

array(data=数组中的数据从1维平铺, dim=给定一个数值型向量, dimnames=list(包含一维名称的向量,二维名称....))

其中data参数用来给出数组的数据从第一维第一个开始顺序向后平铺

dim给定数组的纬度和每纬的宽度

dimnames给每个纬度的每格的名字    #这个参数可以忽略

至于如何读取数组中的数据和矩阵一致这里不再叙述,只不过把二维改成多维的情况。

我截完图发现arr[2,2,2]这个例子并不好,如果我们查看arr[3,2,1]将会显示6。

dimnames用list给予赋值即可。如dimnames=list(rownames,colnames,...)。

R语言数组array函数:

数组是一个可以在两个以上的维度存储数据的R数据对象。例如 - 如果创建尺寸(2,3,4)的数组,那么创建4个矩形矩阵每2行3列。数组只能存储数据类型。使用 array()函数创建数组。它需要向量作为输入,并使用 dim 参数的值,以创建一个数组。

示例:

我们可以通过使用dimnames参数给予名称添加到数组中的行,列和矩阵。

# Create two vectors of different lengths.

vector1 <- c(5,9,3)

vector2 <- c(10,11,12,13,14,15)

column.names <- c("COL1","COL2","COL3")

row.names <- c("ROW1","ROW2","ROW3")

matrix.names <- c("Matrix1","Matrix2")

# Take these vectors as input to the array.

result <- array(c(vector1,vector2),dim=c(3,3,2),dimnames = list(column.names,row.names,matrix.names))

print(result)

当我们上面的代码执行时,它产生以下结果:

1.  , , Matrix1

ROW1 ROW2 ROW3

COL1    5   10   13

COL2    9   11   14

COL3    3   12   15

2.  , , Matrix2

ROW1 ROW2 ROW3

COL1    5   10   13

COL2    9   11   14

COL3    3   12   15

R语言定义多维数组

数组有一个特征属性叫做维数向量(dim属性),维数向量是一个元素取正整数值的向量 ,其长度是数组的维数,比如维数向量有两个元素时数组为二维数组(矩阵)。维数向量的 每一个元素指定了该下标的上界,下标的下界总为1。

一组值只有定义了维数向量(dim属性)后才能被看作是数组。比如:

z <- 1:1500

dim(z) <- c(3, 5, 100)

这时z已经成为了一个维数向量为c(3,5,100)的三维数组。也可以把向量定义为一维数组 ,例如:

dim(z) <- 1500

数组元素的排列次序缺省情况下是采用FORTRAN的数组元素次序(按列次序),即第一下 标变化最快,最后下标变化最慢,对于矩阵(二维数组)则是按列存放。例如,假设数组a的 元素为1:24,维数向量为c(2,3,4),则各元素次序为a[1,1,1], a[2,1,1], a[1,2,1], a[2,2,1], a[1,3,1], …, a[2,3,4]。

用函数array()或matrix()可以更直观地定义数组。array()函数的完全使用为array(x, dim=length(x), dimnames=NULL),其中x是第一自变量,应该是一个向量,表示数组的元素 值组成的向量。dim参数可省,省略时作为一维数组(但不同于向量)。dimnames属性可以省 略,不省略时是一个长度与维数相同的列表(list,见后面),列表的每个成员为一维的名 字。例如上面的z可以这样定义:

z <- array(1:1500, dim=c(3,5,100))

函数matrix()用来定义最常用的一种数组:二维数组,即矩阵。其完全格式为 matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL)

矩阵运算

矩阵是二维数组,但因为其应用广泛所以对它定义了一些特殊的运算和操作。

函数t(A)返回矩阵A的转置。nrow(A)为矩阵A的行数,ncol(A)为矩阵A的列数。

矩阵之间进行普通的加减乘除四则运算仍遵从一般的数组四则运算规则,即数组的对应元 素之间进行运算,所以注意A*B不是矩阵乘法而是矩阵对应元素相乘。

要进行矩阵乘法,使用运算符%%,A%%B表示矩阵A乘以矩阵B(当然要求A的列数等于B的 行数)。例如:

A <- matrix(1:12, nrow=4, ncol=3, byrow=T)

B <- matrix(c(1,0), nrow=3, ncol=2, byrow=T)

A

[,1] [,2] [,3] [1,] 1 2 3 [2,] 4 5 6 [3,] 7 8 9 [4,] 10 11 12

B [,1] [,2] [1,] 1 0 [2,] 1 0 [3,] 1 0

A %*% B

[,1] [,2] [1,] 6 0 [2,] 15 0 [3,] 24 0 [4,] 33 0

另外,向量用在矩阵乘法中可以作为行向量看待也可以作为列向量看待,这要看哪一种观 点能够进行矩阵乘法运算。例如,设x是一个长度为n的向量,A是一个 R语言定义多维数组和数组的运算矩阵,则“x %% A %% x”表示二次型 R语言定义多维数组和数组的运算。但是,有时向量在矩阵乘法中的地位并不 清楚,比如“x %% x”就既可能表示内积 R语言定义多维数组和数组的运算也可能表示 R语言定义多维数组和数组的运算阵 R语言定义多维数组和数组的运算。因为前者较常用,所以S选择表示前者, 但内积最好还是用crossprod(x)来计算。要表示 R语言定义多维数组和数组的运算,可以用“cbind(x) %% x”或“x %*% rbind(x) ”。

函数crossprod(X, Y)表示一般的交叉乘积(内积) R语言定义多维数组和数组的运算,即X的每一列与Y的每一列的内积组成的矩 阵。如果X和Y都是向量则是一般的内积。只写一个参数X的crossprod(X)计算X自身的内积 R语言定义多维数组和数组的运算。

其它矩阵运算还有solve(A,b)解线性方程组 R语言定义多维数组和数组的运算,solve(A)求方阵A的逆矩阵,svd()计算奇 异值分解,qr()计算QR分解,eigen()计算特征向量和特征值