1、R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的RossIhaka和RobertGentleman开发(也因此称为R),现在由R开发核心团队负责开发。
2、html文件是指超文本标记语言(HyperTextMarkupLanguage),标准通用标记语言下的一个应用。HTML不是一种编程语言,而是一种标记语言(markuplanguage),是网页制作所必备的。
画热图中耽误时间较久的部分
https://www.jianshu.com/p/db53f7463d3f?open_source=weibo_search
如下三个数据框
创建一个空list,利用get()将所有数据框写入,形成一个2维的list,然后利用do.call()进行合并
实际中,我用for(i in length(vector)) {} 结果都只有最后一次循环的结果。 改成for(i in c(1:7))) {}
https://www.jianshu.com/p/fd60374d9577?utm_campaign=hugo&utm_medium=reader_share&utm_content=note&utm_source=weixin-friends
数据框就是向量按列组合
setwd("E:/GSE25066")#环境设置
library(limma)#加载差异分析包limma
#将分组文件加载到环境中,分组信息第一列为样本名,第二列为分组信息如“high”“low”
targets<-read.csv("group.csv")
#将表达矩阵加载到环境中,行为基因,列为样本,这里应该注意去除重复项。
eset<-read.csv("expreset-basal1.csv",row.names = "symbol")
targets$Target=gsub("_",".",targets$Target)##若数据中存在特殊符号,将"_"替换成“.”,也可以不替换
##该数据集中实际存在不符合R的命名原则,所以在没个分类前加一个“F”,具体自己定
targets$Target=c(paste0("F",c(targets$Target),collapse = NULL,sep=""))
colnames(targets)=c("FileName","Target")#更改列名,为了和limma包中的一致
lev<-unique(targets$Target)##使用unique()函数进行去重
f <- factor(targets$Target, levels=lev)
design <- model.matrix(~0+f)
colnames(design) <- lev
cont.wt <- makeContrasts("high-low",
+ levels=design)
fit <- lmFit(eset, design)#前面矩阵的row.name=“symbol”
fit2 <- contrasts.fit(fit, cont.wt)
fit2 <- eBayes(fit2)
tT=topTable(fit2, adjust="BH",sort.by="logFC",n=Inf)
tT = subset(tT, select=c("adj.P.Val","P.Value","logFC"))
colnames(tT)=c("FDR","P.Value","logFC")
write.csv(tT,"DEGbasal.csv")
#最后的tT就是得到的差异基因,其中包含基因,P.Value和logFC