R语言中执行limma包中的lmFit时出错

Python016

R语言中执行limma包中的lmFit时出错,第1张

您好,这样的:

步骤1:打开你电脑中的杀毒软件

步骤2:关掉杀毒软件的实时防护/监控功能

步骤3:在线或本地安装你要装的R安装包

步骤4:安装完R安装包后,重新打开杀毒软件的实时防护/监控功能。

步骤5:在R中运行你刚才安装的包。

sion 3.0.1 (2013-05-16)

Platform: i386-w64-mingw32/i386 (32-bit)

locale:

[1] LC_COLLATE=Chinese (Simplified)_People's Republic of China.936

[2] LC_CTYPE=Chinese (Simplified)_People's Republic of China.936

[3] LC_MONETARY=Chinese (Simplified)_People's Republic of China.936

[4] LC_NUMERIC=C

[5] LC_TIME=Chinese (Simplified)_People's Republic of China.936

attached base packages:

[1] stats graphics grDevices utils datasets methods base

R可以将分析出的结果轻松保存,并作为进一步分析的输入使用

举例:

利用汽车数据mtcars执行一次简单的线性回归,通过车身重量(wt)预测每加仑行驶的英里数(mpg),执行数据,结果显示在屏幕上,不保存任何信息。

执行回归,在一个对象中保存结果

创建了一个名为lmfit的列表对象,虽然没有显示任何输出,但分析结果稍后被显示和继续使用,其中包含了大量的信息:预测值、残差、回归系数等

summary(lmfit):显示分析结果的统计概要

plot(lmfit)生成回归诊断图形

predict(lmfit):预测

setwd("E:/GSE25066")#环境设置

library(limma)#加载差异分析包limma

#将分组文件加载到环境中,分组信息第一列为样本名,第二列为分组信息如“high”“low”

targets<-read.csv("group.csv")

#将表达矩阵加载到环境中,行为基因,列为样本,这里应该注意去除重复项。

eset<-read.csv("expreset-basal1.csv",row.names = "symbol")

targets$Target=gsub("_",".",targets$Target)##若数据中存在特殊符号,将"_"替换成“.”,也可以不替换

##该数据集中实际存在不符合R的命名原则,所以在没个分类前加一个“F”,具体自己定

targets$Target=c(paste0("F",c(targets$Target),collapse = NULL,sep=""))

colnames(targets)=c("FileName","Target")#更改列名,为了和limma包中的一致

lev<-unique(targets$Target)##使用unique()函数进行去重

f <- factor(targets$Target, levels=lev)

design <- model.matrix(~0+f)

colnames(design) <- lev

cont.wt <- makeContrasts("high-low",

                      +  levels=design)

fit <- lmFit(eset, design)#前面矩阵的row.name=“symbol”

fit2 <- contrasts.fit(fit, cont.wt)

fit2 <- eBayes(fit2)

tT=topTable(fit2, adjust="BH",sort.by="logFC",n=Inf)

tT = subset(tT, select=c("adj.P.Val","P.Value","logFC"))

colnames(tT)=c("FDR","P.Value","logFC")

write.csv(tT,"DEGbasal.csv")

#最后的tT就是得到的差异基因,其中包含基因,P.Value和logFC