Retruns a vector or array or list of values obtained by applying a function to margins of an array or matrix.
就是说apply把一个function作用到array或者matrix的margins(可以理解为数组的每一行或者每一列)中,返回值时vector、array、list。
简单的说,apply函数经常用来计算矩阵中行或列的均值、和值的函数,具体方法如下:
定义一个3×2的矩阵:
rname = c("one","two","three")
cname = c("first","second")
b <- matrix(1:6,nrow=3, dimnames = list(rname, cname))
b为:
first second
one 1 4
two 2 5
three 3 6
继续举几个例子:
apply(b,1,sum)
上面的指令代表对矩阵b进行行计算,分别对每一行进行求和。函数涉及了三个参数:
第一个参数是指要参与计算的矩阵;
第二个参数是指按行计算还是按列计算,1——表示按行计算,2——按列计算;
第三个参数是指具体的运算参数。
上述指令的返回结果为:
one two three
5 7 9
值得注意的是,apply函数时可以针对数组进行计算你的,就是说数组未必是2维的!!
举一个3维的情况:
首先顶一个三维数组:
x=array(1:24,c(2,3,4))
三维数组为:
, , 1
[,1] [,2] [,3]
[1,]135
[2,]246
, , 2
[,1] [,2] [,3]
[1,]79 11
[2,]8 10 12
, , 3
[,1] [,2] [,3]
[1,] 13 15 17
[2,] 14 16 18
, , 4
[,1] [,2] [,3]
[1,] 19 21 23
[2,] 20 22 24
使用如下指令:
apply(x,1,sum)
则对1到23的所有奇数进行求和,结果为:
[1] 144 156
同样,第二个参数改成2后,
apply(x,2,sum)
结果为:
[1] 84 100 116
是按照第二个维度进行的求和计算。
第二个参数改成3后,
apply(x,3,sum)
结果为:
[1] 21 57 93 129
即对第三个维度进行求和计算。
对于apply()函数的第三个参数,制定了具体用什么函数进行计算,之前例子里使用的都是sum,对于用户自定义的函数同样可以在这里使用。还用前面的矩阵b来举例。
定义了一个求平方和的函数:
myfun <- function(x){
sum(x^2)
}
如果选择按行计算平方和,可使用如下指令:
apply(b,1,myfun)
计算结果为:
one two three
172945
通常情况大家使用apply之后是需要把apply的返回值作为输入在其他代码中使用的,这里尤其重要的一点是apply的返回值的维度。上面的例子就算每一行或者每一列的sum,使用apply之后,返回都是一个向量,并不会因为apply计算行(列)的sum就会自动返回一个列(行)向量。
函数主体可以是一系列表达式,这些表达式需要用大括号括起来:function(param1,,paramN){expr1exprM}讨论函数的定义告诉R软件“用何种方式进行计算”。例如,R软件没有内置计算变异系数的函数,因此你可以定义函数如下:>cvcv(1:10)[1]0.5504819第一行定义了名为cv的函数,第二行引用该函数,以1∶10作为其参数x的值。函数对参数应用函数主体中的表达式sd(x)/mean(x)进行计算并返回结果。定义函数后,我们可以在任何需要函数的地方应用它,例如可以作为lapply函数的第二个参数(参见方法6.2):>cvlapply(lst,cv)函数主体如果包含多行表达式,则需要使用大括号来确定函数内容的起始和结束位置。下面这一函数采用了欧几里德算法计算两个整数的最大公约数:>gcdlapply(lst,function(x)sd(x)/mean(x))由于本书重点不在于介绍R的编程语言,这里不对R函数编程的细微之处进行解释。下面给出几个需要注意的地方:返回值所有函数都有一个返回值,即函数主体最后一个表达式值。你也可以通过return(expr)命令给出函数的返回值。值调用函数参数是“值调用”——如果你改变了函数中的参数值,改变只是局部的,并不会影响该参数所引用的变量值。局部变量你可以简单地通过赋值来创建一个局部变量,函数结束后该局部变量会消失。条件执行R语法中包含if语句,详情可以使用help(Control)命令查看。循环语句