library(limma)#加载差异分析包limma
#将分组文件加载到环境中,分组信息第一列为样本名,第二列为分组信息如“high”“low”
targets<-read.csv("group.csv")
#将表达矩阵加载到环境中,行为基因,列为样本,这里应该注意去除重复项。
eset<-read.csv("expreset-basal1.csv",row.names = "symbol")
targets$Target=gsub("_",".",targets$Target)##若数据中存在特殊符号,将"_"替换成“.”,也可以不替换
##该数据集中实际存在不符合R的命名原则,所以在没个分类前加一个“F”,具体自己定
targets$Target=c(paste0("F",c(targets$Target),collapse = NULL,sep=""))
colnames(targets)=c("FileName","Target")#更改列名,为了和limma包中的一致
lev<-unique(targets$Target)##使用unique()函数进行去重
f <- factor(targets$Target, levels=lev)
design <- model.matrix(~0+f)
colnames(design) <- lev
cont.wt <- makeContrasts("high-low",
+ levels=design)
fit <- lmFit(eset, design)#前面矩阵的row.name=“symbol”
fit2 <- contrasts.fit(fit, cont.wt)
fit2 <- eBayes(fit2)
tT=topTable(fit2, adjust="BH",sort.by="logFC",n=Inf)
tT = subset(tT, select=c("adj.P.Val","P.Value","logFC"))
colnames(tT)=c("FDR","P.Value","logFC")
write.csv(tT,"DEGbasal.csv")
#最后的tT就是得到的差异基因,其中包含基因,P.Value和logFC
R语言如何组成矩阵#利用已有数据组建新的矩阵
v1 <- c(1:4) #创建名为v1的向量
v2 <- c(5:8) #创建名为v2的向量
m5 <- rbind(v1,v2) #将向量v1和v2按行合并为一个矩阵
m6 <- cbind(v1,v2) #将向量v1和v2按列合并为一个矩阵
#参考R语言中常见的几种创建矩阵形式总结_R语言_脚本之家 (jb51.net)
修改列名,
如果是矩阵使用colnames(chr1_edite) <- c("chrom","map","Likelihood")
如果是数据框使用names(chr1_edite) <- c("chrom","map","Likelih111")
但是数据框也可以用colnames()进行修改
x%in%y 返回逻辑向量,表示x中是否有元素在y