R语言定义多维数组

2023-04-04 12:12:02Python020

R语言定义多维数组,第1张

R语言定义多维数组

数组有一个特征属性叫做维数向量（dim属性），维数向量是一个元素取正整数值的向量，其长度是数组的维数，比如维数向量有两个元素时数组为二维数组（矩阵）。维数向量的每一个元素指定了该下标的上界，下标的下界总为1。

一组值只有定义了维数向量（dim属性）后才能被看作是数组。比如：

z <- 1:1500

dim(z) <- c(3, 5, 100)

这时z已经成为了一个维数向量为c(3,5,100)的三维数组。也可以把向量定义为一维数组，例如：

dim(z) <- 1500

数组元素的排列次序缺省情况下是采用FORTRAN的数组元素次序（按列次序），即第一下标变化最快，最后下标变化最慢，对于矩阵（二维数组）则是按列存放。例如，假设数组a的元素为1:24，维数向量为c(2,3,4)，则各元素次序为a[1,1,1], a[2,1,1], a[1,2,1], a[2,2,1], a[1,3,1], …, a[2,3,4]。

用函数array()或matrix()可以更直观地定义数组。array()函数的完全使用为array(x, dim=length(x), dimnames=NULL)，其中x是第一自变量，应该是一个向量，表示数组的元素值组成的向量。dim参数可省，省略时作为一维数组（但不同于向量）。dimnames属性可以省略，不省略时是一个长度与维数相同的列表（list，见后面），列表的每个成员为一维的名字。例如上面的z可以这样定义：

z <- array(1:1500, dim=c(3,5,100))

函数matrix()用来定义最常用的一种数组：二维数组，即矩阵。其完全格式为 matrix(data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL)

矩阵运算

矩阵是二维数组，但因为其应用广泛所以对它定义了一些特殊的运算和操作。

函数t(A)返回矩阵A的转置。nrow(A)为矩阵A的行数，ncol(A)为矩阵A的列数。

矩阵之间进行普通的加减乘除四则运算仍遵从一般的数组四则运算规则，即数组的对应元素之间进行运算，所以注意A*B不是矩阵乘法而是矩阵对应元素相乘。

要进行矩阵乘法，使用运算符%%，A%%B表示矩阵A乘以矩阵B（当然要求A的列数等于B的行数）。例如：

A <- matrix(1:12, nrow=4, ncol=3, byrow=T)

B <- matrix(c(1,0), nrow=3, ncol=2, byrow=T)

[,1] [,2] [,3] [1,] 1 2 3 [2,] 4 5 6 [3,] 7 8 9 [4,] 10 11 12

B [,1] [,2] [1,] 1 0 [2,] 1 0 [3,] 1 0

A %*% B

[,1] [,2] [1,] 6 0 [2,] 15 0 [3,] 24 0 [4,] 33 0

另外，向量用在矩阵乘法中可以作为行向量看待也可以作为列向量看待，这要看哪一种观点能够进行矩阵乘法运算。例如，设x是一个长度为n的向量，A是一个 R语言定义多维数组和数组的运算矩阵，则“x %% A %% x”表示二次型 R语言定义多维数组和数组的运算。但是，有时向量在矩阵乘法中的地位并不清楚，比如“x %% x”就既可能表示内积 R语言定义多维数组和数组的运算也可能表示 R语言定义多维数组和数组的运算阵 R语言定义多维数组和数组的运算。因为前者较常用，所以S选择表示前者，但内积最好还是用crossprod(x)来计算。要表示 R语言定义多维数组和数组的运算，可以用“cbind(x) %% x”或“x %*% rbind(x) ”。

函数crossprod(X, Y)表示一般的交叉乘积（内积） R语言定义多维数组和数组的运算，即X的每一列与Y的每一列的内积组成的矩阵。如果X和Y都是向量则是一般的内积。只写一个参数X的crossprod(X)计算X自身的内积 R语言定义多维数组和数组的运算。

其它矩阵运算还有solve(A,b)解线性方程组 R语言定义多维数组和数组的运算，solve(A)求方阵A的逆矩阵，svd()计算奇异值分解，qr()计算QR分解，eigen()计算特征向量和特征值

R语言数组和矩阵 1 数组数组可以看成一个由递增下标表示的数据项的集合，例如数值。数组的生成如果一个向量需要在R中以数组的方式被处理，则必须含有一个维数向量作为它的dim属性。维度向量由dim()指定，例如，z是一个由1500个元素组成的向量。下面的赋值语句>dim(z) <- c(3,5,100)使它具有dim属性，并且将被当作一个3X5X100的数组进行处理。 c(3,5,100) 就是他的维度向量。还可以用到像matrix()和array()这样的函数来赋值。比如>array(1:20, dim=c(4,5))>matrix(1:24, 3,4)数据向量中的值被赋给数组中的值时，将遵循与FORTRAN相同的原则"主列顺序"，即第一个下标变化的最快，最后的下标变化最慢。数组的运算数组可以在算数表达式中使用，结果也是一个数组，这个数组由数据向量逐个元素的运算后组成，通常参与运算的对象应当具有相同的dim属性。2 数组的索引和数组的子块数组中的单个元素可以通过下标来指定，下标由逗号分隔，写在括号内。我们可以通过在下标的位置给出一个索引向量来指定一个数组的子块，不过如果在任何一个索引位置上给出空的索引向量，则相当于选取了这个下标的全部范围。如a[2,,]，a[,3,]等3 索引数组除了索引向量，还可以使用索引数组来指定数组的某些元素。例如：有4X5的数组a，若要得到a中的a[1,3], a[2,2] 和a[3,1]这三个元素，可以生成索引向量i，然后用a[i]得到它们。>a <- array(1:20,dim=c(4,5)) # Generate a 4 by 5 array.>i <- array(c(1:3,3:1),dim=c(3,2))>i[,1] [,2][1,] 1 3[2,] 2 2[3,] 3 1>a[i][1] 9 6 3>a[i] <- 0 # 将这三个元素用0替换。4 向量，数组的混合运算表达式从左到右被扫描；参与运算的任意对象如果大小不足，都将被重复使用直到与其他参与运算的对象等长；当较短的向量和数组在运算中相遇时，所有的数组必须具有相同的dim属性，否则返回一个错误；如果有任意参与运算的向量比参与运算的矩阵或数组长，将会产生错误；如果数组结构正常声称，并且没有错误或者强制转换被应用于向量上，那么得到的结果与参与运算的数组具有相同的dim属性。5 矩阵的运算构建分区矩阵：cbind()和rbind()，cbind()按照水平方向，或者说按列的方式将矩阵连接到一起。rbind()按照垂直的方向，或者说按行的方式将矩阵连接到一起。外积：操作符是%o%:>ab <- a %o% b 或者>ab <- outer(a, b, "*")其中的乘法操作可以由任意一个双变量的函数替代。广义转置：函数t(A)，或aperm(A, c(2,1))；获取行数/列数：nrow(A)和ncol(A)分别返回矩阵A的行数和列数。矩阵乘法：操作符为%*%；交叉乘积（cross product）：crossprod(X，Y)等同于t(X) %*% y，crossprod(X)等价于crossprod(X, X)；diag(v)：如果v是向量，diag(v)返回一个由v的元素为对角元素的对角矩阵。如果v为矩阵，diag(v)返回一个由v主对角元素组成的向量。如果v只是一个数值，那么diag(v)是一个vXv的单位矩阵。特征值和特征向量：eigen(Sm)。这个函数的结果是由名为values和vectors的两部分组成的列表。如果只是需要特征值：eigen(Sm)$values 最小二乘拟合即QR分解：lsfit(), qr()。强制转换为向量：as.vector()，或者直接c().

之前我们讲了向量，向量就仿佛一个一维数组一样

那么我们接下来就讲讲二维数组

创建一个matrix需要用到matrix函数

martix(参数1,nrow=行数,ncol=列数,byrow=布尔值)

参数1：matrix初始化的值，如果给出的值不够matrix长度将重复赋值，如果给出的值溢出将会报错。

参数byrow：这是一个布尔值如果给定TRUE，初始数据按行顺序推进，反之按列顺序推进。

这里说一下R语言中 ' . ' 并没有特殊的意义，只是变量名的一部分

读取矩阵我们用到：矩阵名[行,列]

这里的行和列可以接收单个数组也可以接收一个向量

当然如果是负数和向量一样就是排除掉对应索引指向的值

test.m[2, ] #取第二行，我们注意这里把列的地方空出来就是显示所有列

test.m[ ,2] #取第二列