R中tapply函数

Python025

R中tapply函数,第1张

R中tapply函数

有时候,我们需要对组数据进行函数计算,怎么办?首先,创建一个分组因子用来识别每个对应的数据组;然后,使用R中tapply函数,它会把一个函数应用到每组数据。语法格式如下。

tapply(x, f, fun)

说明:x是一个向量,f是一个分组因子,fun是一个函数。函数返回一个对分组数据进行fun运算所得结果而构成的一个向量。

关于tapply函数,举例说明如下。

>data1 <- c(100, 200, 300, 400, 150, 180)

>sum(data1)

[1] 1330

>mean(data1)

[1] 221.6667

>f1 <- factor(c("A", "B", "A", "B", "A", "B"))

>tapply(data1, f1, sum)

A B

550 780

>tapply(data1, f1, mean)

AB

183.3333 260.0000

>tapply(data1, f1, length)

A B

3 3

1、先在R中创建简单的矩阵,取名为my_matrix

2、现在对每一行进行求和,要使用到apply函数。apply族函数有很多,在平常的使用中,用到最多的就是tapply函数,第一个参数x是数据;第二个参数index是索引,就比如是分组的标准,第三个参数fun也就是要用到的函数。

3、对于tapply函数调用R本身自带的数据airquality,现在计算按照Month来分组,每一个Month中Solar.R的均值

4、上图中Month等于5和8时,Solar.R的均值为NA,这说明在原数据中存在NA的情况。而且在指定数据的时候比较麻烦,可以使用with函数来简化代码量

5、矩阵与矩阵之间的运算,比如加法,减法

6、矩阵相乘需要使用%*%符号

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。