r语言求平均值

Python020

r语言求平均值,第1张

1.导入数据install.packages('xslx')library(xlsx)Sys.setlocale("LC_ALL", "zh_cn.utf-8")a=read.xlsx2('d:/1.xlsx',1,header=F)2.计算平均值数据集a中有变量:因变量y,自变量xinstall.packages('Rmisc')library(Rmisc)单因素:求y的平均值,以x为分类变量a1=summarySE(a,measurevar='y', groupvars=c('x'))双因素:求y的平均值,以x1和x2为分类变量a1=summarySE(a,measurevar='y', groupvars=c('x1','x2'))如果是简单数据,数据集a中有变量:只有因变量y,没有自变量x。求y的平均值代码如下:mean(a$y)

在基因芯片数据或其他类型数据中,采用计算所有样本的平均值从而进行填充,如果需要用中位数或其他统计量填充时只需修改相应的方法即可

#1. 检查是否有缺失值

which(is.na(mRNA),arr.ind = T)

#2. 计算行均值并填充

#该数据中探针(基因)为行(名),样本为列(名),(数据框内容为表达量数据值型数据数据)格式可见文章最后

row_mean <- apply(mRNA,1,mean,na.rm =T) #1是行,2是列,若用其他方法修改mean即可

mRNA$MEAN <- row_mean

ncol = 样本数

for (i in 1:nrow(mRNA)) {

  mRNA[i,is.na(mRNA[i,])] <- mRNA[i,ncol]

}