install.packages('xslx')
library(xlsx)
Sys.setlocale("LC_ALL", "zh_cn.utf-8")
a=read.xlsx2('d:/1.xlsx',1,header=F)
2.计算平均值
数据集a中有变量:因变量y,自变量x
install.packages('Rmisc')
library(Rmisc)
单因素:求y的平均值,以x为分类变量
a1=summarySE(a,measurevar='y', groupvars=c('x'))
双因素:求y的平均值,以x1和x2为分类变量
a1=summarySE(a,measurevar='y', groupvars=c('x1','x2'))
如果是简单数据,数据集a中有变量:只有因变量y,没有自变量x。求y的平均值代码如下:
mean(a$y)
#把年份取出来,按10年分成一组decade <- ceiling(Temp_m[1] / 10)
names(decade) <- "decade"
#把分组信息合并成原数据框
Temp_m <- cbind.data.frame(Temp_m, decade)
#加载plyr包。
#把Temp_m这个数据框中除year列的数据外,按照decade分组分别把每列求算术平均值。
#并放在Temp_mean10数据框中。
#Temp_mean10含有decade信息,进行索引时需要注意。
library(plyr)
Temp_mean10 <- ddply(Temp_m[-1], .(decade), colwise(mean))