2019-07-23

Python011

2019-07-23,第1张

R语言中的apply函数

1、 lapply函数

lapply函数是一个最基础循环操作函数之一,用来对list、data.frame、vector(达不到理想效果,因为他会返回list)数据集进行循环,并返回和X长度同样的list结构作为结果集,通过lapply的开头的第一个字母 ' l ' 就可以判断返回结果集的类型。

定义:lapply(X, FUN, ...)     参数列表:X:list、data.frame数据;FUN: 自定义的调用函数;…: 更多参数,可选

例:lapply(temp,min)   temp是list,七列,每列5个元素。

sapply(temp,min)

2、sapply函数

sapply函数是一个简化版的lapply,sapply增加了2个参数simplify和USE.NAMES,返回值为向量。list or vector 

定义:sapply(X, FUN, ..., simplify=TRUE, USE.NAMES = TRUE)

参数列表:X:数组、矩阵、数据框;FUN: 自定义的调用函数;…: 更多参数,可选;simplify: 是否数组化;当值为"array"时,输出结果按数组进行分组;USE.NAMES: 如果X为字符串,TRUE设置字符串为数据名,FALSE不设置

3、vapply函数

vapply类似于sapply,提供了FUN.VALUE参数,用来控制返回值的行名,这样可以让程序更健壮。

定义:vapply(X, FUN, FUN.VALUE, ..., USE.NAMES = TRUE)

参数列表:X:数组、矩阵、数据框;FUN: 自定义的调用函数;

FUN.VALUE: 定义返回值的行名row.names,需要一个模板作为函数FUN的返回参数;

…: 更多参数,可选;USE.NAMES: 如果X为字符串,TRUE设置字符串为数据名,FALSE不设置

例如FUN.VALUE用法:

比如:

for(i in 1:10){

x<-c(x,i+1)

t<-c(x,i-1)

}

现在用apply替换的话我尝试这样写:

f=function(x){

t=x+1

m=x-1}

a=apply(as.matrix(1:10), 1,f)

但是结果只出来一行,[1] 0 1 2 3 4 5 6 7 8 9

在R语言的帮助文档里,apply函数的功能是:

Retruns a vector or array or list of values obtained by applying a function to margins of an array or matrix.

就是说apply把一个function作用到array或者matrix的margins(可以理解为数组的每一行或者每一列)中,返回值时vector、array、list。

简单的说,apply函数经常用来计算矩阵中行或列的均值、和值的函数,具体方法如下:

定义一个3×2的矩阵:

rname = c("one","two","three")

cname = c("first","second")

b <- matrix(1:6,nrow=3, dimnames = list(rname, cname))

b为:

first second

one 1 4

two 2 5

three 3 6

继续举几个例子:

apply(b,1,sum)

上面的指令代表对矩阵b进行行计算,分别对每一行进行求和。函数涉及了三个参数:

第一个参数是指要参与计算的矩阵;

第二个参数是指按行计算还是按列计算,1——表示按行计算,2——按列计算;

第三个参数是指具体的运算参数。

上述指令的返回结果为:

one two three

5 7 9

值得注意的是,apply函数时可以针对数组进行计算你的,就是说数组未必是2维的!!

举一个3维的情况:

首先顶一个三维数组:

x=array(1:24,c(2,3,4))

三维数组为:

, , 1

[,1] [,2] [,3]

[1,]135

[2,]246

, , 2

[,1] [,2] [,3]

[1,]79 11

[2,]8 10 12

, , 3

[,1] [,2] [,3]

[1,] 13 15 17

[2,] 14 16 18

, , 4

[,1] [,2] [,3]

[1,] 19 21 23

[2,] 20 22 24

使用如下指令:

apply(x,1,sum)

则对1到23的所有奇数进行求和,结果为:

[1] 144 156

同样,第二个参数改成2后,

apply(x,2,sum)

结果为:

[1] 84 100 116

是按照第二个维度进行的求和计算。

第二个参数改成3后,

apply(x,3,sum)

结果为:

[1] 21 57 93 129

即对第三个维度进行求和计算。

对于apply()函数的第三个参数,制定了具体用什么函数进行计算,之前例子里使用的都是sum,对于用户自定义的函数同样可以在这里使用。还用前面的矩阵b来举例。

定义了一个求平方和的函数:

myfun <- function(x){

sum(x^2)

}

如果选择按行计算平方和,可使用如下指令:

apply(b,1,myfun)

计算结果为:

one two three

172945

通常情况大家使用apply之后是需要把apply的返回值作为输入在其他代码中使用的,这里尤其重要的一点是apply的返回值的维度。上面的例子就算每一行或者每一列的sum,使用apply之后,返回都是一个向量,并不会因为apply计算行(列)的sum就会自动返回一个列(行)向量。