r语言求平均值

Python020

r语言求平均值,第1张

1.导入数据install.packages('xslx')library(xlsx)Sys.setlocale("LC_ALL", "zh_cn.utf-8")a=read.xlsx2('d:/1.xlsx',1,header=F)2.计算平均值数据集a中有变量:因变量y,自变量xinstall.packages('Rmisc')library(Rmisc)单因素:求y的平均值,以x为分类变量a1=summarySE(a,measurevar='y', groupvars=c('x'))双因素:求y的平均值,以x1和x2为分类变量a1=summarySE(a,measurevar='y', groupvars=c('x1','x2'))如果是简单数据,数据集a中有变量:只有因变量y,没有自变量x。求y的平均值代码如下:mean(a$y)

如下:

数据集a有变量:x1,x2,x3等等

求各变量的均值方差,代码如下:

mean(a$x1) var(a$x1)。

mean(a$x2) var(a$x2)。

mean(a$x3) var(a$x3)。

……

如果有无效值,需要在括号内加入na.rm=T。

R是用于统计分析、绘图的语言和操作环境。

R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。

R可以看作贝尔实验室(AT&T BellLaboratories)的Rick Becker、John Chambers和Allan Wilks开发的S语言的一种实现。当然,S语言也是S-Plus的基础。

所以,两者在程序语法上可以说是几乎一样的,可能只是在函数方面有细微差别,程序十分容易地就能移植到一程序中,而很多一的程序只要稍加修改也能运用于R。

#把年份取出来,按10年分成一组

decade <- ceiling(Temp_m[1] / 10)

names(decade) <- "decade" 

#把分组信息合并成原数据框

Temp_m <- cbind.data.frame(Temp_m, decade) 

#加载plyr包。

#把Temp_m这个数据框中除year列的数据外,按照decade分组分别把每列求算术平均值。

#并放在Temp_mean10数据框中。

#Temp_mean10含有decade信息,进行索引时需要注意。

library(plyr)

Temp_mean10 <- ddply(Temp_m[-1], .(decade), colwise(mean))