R语言初级教程(15): 矩阵(下篇)

Python017

R语言初级教程(15): 矩阵(下篇),第1张

这是最后一篇讲解有关矩阵操作的博客,介绍有关矩阵的函数,主要有 rowSums() , colSums() , rowMeans() , colMeans() , apply() , rbind() , cbind() , row() , col() , rowsum() , aggregate() , sweep() , max.col() 。

下面通过例子来了解这些函数的用法:

我们知道,通过下标索引 [i, j] 可以访问矩阵的某一部分,索引如果没有提供意味着“所有行”或“所有列”。来看个例子,比如:

在R中,可以用一些特殊的函数来进行矩阵的行、列计算。来看些例子:

上述矩阵的行、列计算,还可以使用 apply() 函数来实现。 apply() 函数的原型为 apply(X, MARGIN, FUN, ...) ,其中: X 为矩阵或数组; MARGIN 用来指定是对行运算还是对列运算, MARGIN=1 表示对行运算, MARGIN=2 表示对列运算; FUN 用来指定运算函数; ... 用来指定 FUN 中需要的其它参数。来看些例子:

用 apply() 函数来实现上面的例子

apply() 函数功能很强大,我们可以对矩阵的行或列进行其它运算,例如:

如果矩阵存在 NA 值,可通过设置 na.rm=TRUE 来忽略 NA 值,然后再计算。比如:

甚至我们还可以自定义运算函数,来看个例子:

在R中, rbind() 和 cbind() 函数可分别为矩阵添加行和列,来看一个例子:

在R中, row() 和 col() 函数将分别返回元素的行和列下标矩阵,来看个例子:

通过这两个函数,可以获取矩阵的对角元素以及上下三角矩阵,例如:

有时,你可能需要对每行进行分组,然后组内每列求和。在R中可以用 rowsum() 函数来解决,而且效率也非常高。先看个例子:

你也可以用 aggregate() 函数获得类似结果:

有人就会问“为啥没有列分组求和的操作?”,其实你可以先将矩阵转置,然后行分组求和;这两步就等同于列分组求和。

sweep() 函数的原型为 sweep(x, MARGIN, STATS, FUN = "-", check.margin = TRUE, ...) ,其中: x 为矩阵或数组; MARGIN 用来指定是对行运算还是对列运算, MARGIN=1 表示对行运算, MARGIN=2 表示对列运算; STATS 表示想要清除的统计量; FUN 用来指定运算函数,默认为减法 - ; check.margin 用来核实 x 的维度是否与 STATS 的匹配,如果事先知道它们匹配的话,将其设为 FALSE 将提高运算速度; ... 用来指定 FUN 中需要的其它参数。来看些例子:

事实上,通过改变 FUN 参数的具体形式或自定义函数, sweep() 函数可以实现很多不同操作,这里就不细讲了。

max.col() 函数返回矩阵每行最大值所在的列位置(即列下标),其原型为 max.col(m, ties.method = c("random", "first", "last")) ,其中: m 为矩阵;当存在多个最大值时, ties.method 指定用哪种方式来处理这种情况,默认为"random"(随机),"first"指使用第一个最大值,"last"指使用最后一个最大值。来看个官网例子:

我们也可以结合 apply() 和 which.max() 函数来实现 max.col(mm, 'first') 。看个例子,

R矩阵的最后一部分内容就讲到这。

如若有遗漏,后期将会添加至本博客。

Sys.Date( ) returns today's date.

date() returns the current date and time.

# print today's date

today <-Sys.Date()

format(today, format="%B %d %Y")

"June 20 2007"

# convert date info in format 'mm/dd/yyyy'

strDates <- c("01/05/1965", "08/16/1975")

dates <- as.Date(strDates, "%m/%d/%Y")

# convert dates to character data

strDates <- as.character(dates)

--------------------------------------

>as.Date('1915-6-16')

[1] "1915-06-16"

>as.Date('1990/02/17')

[1] "1990-02-17"

>as.Date('1/15/2001',format='%m/%d/%Y')

[1] "2001-01-15"

>as.Date('April 26, 2001',format='%B %d, %Y')

[1] "2001-04-26"

>as.Date('22JUN01',format='%d%b%y') # %y is system-specificuse with caution

[1] "2001-06-22"

>bdays = c(tukey=as.Date('1915-06-16'),fisher=as.Date('1890-02-17'),

+ cramer=as.Date('1893-09-25'), kendall=as.Date('1907-09-06'))

>weekdays(bdays)

tukey fisher cramer kendall

"Wednesday""Monday""Monday""Friday"

>dtimes = c("2002-06-09 12:45:40","2003-01-29 09:30:40",

+"2002-09-04 16:45:40","2002-11-13 20:00:40",

+"2002-07-07 17:30:40")

>dtparts = t(as.data.frame(strsplit(dtimes,' ')))

>row.names(dtparts) = NULL

>thetimes = chron(dates=dtparts[,1],times=dtparts[,2],

+ format=c('y-m-d','h:m:s'))

>thetimes

[1] (02-06-09 12:45:40) (03-01-29 09:30:40) (02-09-04 16:45:40)

[4] (02-11-13 20:00:40) (02-07-07 17:30:40)

>dts = c("2005-10-21 18:47:22","2005-12-24 16:39:58",

+ "2005-10-28 07:30:05 PDT")

>as.POSIXlt(dts)

[1] "2005-10-21 18:47:22" "2005-12-24 16:39:58"

[3] "2005-10-28 07:30:05"

>dts = c(1127056501,1104295502,1129233601,1113547501,

+ 1119826801,1132519502,1125298801,1113289201)

>mydates = dts

>class(mydates) = c('POSIXt','POSIXct')

>mydates

[1] "2005-09-18 08:15:01 PDT" "2004-12-28 20:45:02 PST"

[3] "2005-10-13 13:00:01 PDT" "2005-04-14 23:45:01 PDT"

[5] "2005-06-26 16:00:01 PDT" "2005-11-20 12:45:02 PST"

[7] "2005-08-29 00:00:01 PDT" "2005-04-12 00:00:01 PDT"

>mydate = strptime('16/Oct/2005:07:51:00',format='%d/%b/%Y:%H:%M:%S')

[1] "2005-10-16 07:51:00"

>ISOdate(2005,10,21,18,47,22,tz="PDT")

[1] "2005-10-21 18:47:22 PDT"

>thedate = ISOdate(2005,10,21,18,47,22,tz="PDT")

>format(thedate,'%A, %B %d, %Y %H:%M:%S')

[1] "Friday, October 21, 2005 18:47:22"

>mydate = as.POSIXlt('2005-4-19 7:01:00')

>names(mydate)

[1] "sec" "min" "hour" "mday" "mon" "year"

[7] "wday" "yday" "isdst"

>mydate$mday

[1] 19

将4张图分屏显示在同一图中,代码如下:

数据:

pie.sales <-c(39,200,42,15,67,276,27,66)

names(pie.sales) <- c("EUL","PES","EFA","EDD","ELDR","EPP","UNE","other")

分屏:

split.screen(c(2,2))

figure 1:

screen(1)

pie(pie.sales,radius = 0.9,main = "Ordinary chart")

figure 2:

screen(2)

pie(pie.sales,radius = 0.9,col = rainbow(8),clock = T,main = "Rainbow colours")

figure 3:

screen(3)

pie(pie.sales,radius = 0.9,clock = T,col = gray(seq(0.4,1.0,length = 8)),main = "Grey colours")

figure 4:

screen(4)

pie(pie.sales,radius = 0.9,density = 10,angle = 15 + 15*1:8,main = "The density of shading lines")

图像个数可以根据需要自定义添加。

扩展资料

R语言是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

R语言是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具;完整连贯的统计分析工具;优秀的统计制图功能。

参考资料来源:百度百科-R语言