R012 基本图形-小提琴图vioplot()

Python020

R012 基本图形-小提琴图vioplot(),第1张

小提琴图在结束箱线图的讨论之前,有必要研究一种称为小提琴图(violin plot)的箱线图变种。小提琴图是箱线图与核密度图的结合。你可以使用vioplot包中的vioplot()函数绘制它。请在第一次使用之前安装vioplot包。vioplot()函数的使用格式为:

vioplot(x1,x2,…, names=, col= )

其中x1, x2, ...表示要绘制的一个或多个数值向量(将为每个向量绘制一幅小提琴图)。参数names是小提琴图中标签的字符向量,而col是一个为每幅小提琴图指定颜色的向量

小提琴图基本上是核密度图以镜像方式在箱线图上的叠加。

R是我们做生信进行图形展示较为常用的软件,我们在经常使用R进行数据展示,画一个或者几个图,但我们做生信的,批量化是我们最重要的目标之一。比如有时候可能有几万个图需要画,我们不可能一个一个的去画图,这时候就需要进行批量画图。

R循环画图循环画图挺简单,主要是在dev.off()之前,加上一句print(p)即可,这里的p为画图对象,如下所示:

```

for (i in cluster){

name<-paste(i,'cluster_VlnPlot',sep='_')

mkdirs(paste(outdir,'3_marker',sep='/'),name)

for(m in 1:nrow(all.markers)){

if (all.markers["cluster"][m,]==i){

filename<-paste(gene.list[m],'VlnPlot.pdf',sep='_')

graph <- paste(name,filename,sep='/')

pdf(graph, w=12, h=8)

p<-VlnPlot(object = immune.combined, features.plot = c(gene.list[m]), return.plotlist=TRUE,point.size.use = -1,cols.use=color,size.x.use = -1)

print(p)

plot_grid(p)

dev.off()

}

}

}

```

这里print(p)是循环的关键

我们在画图或者操作的时候,可能有时候某个基因不在我们已有的文件,我们直接循环画图,将会出现报错,而且这个报错后面所有的图都将无法正常完成,因此这里需要使用try语句,如果报错,直接打印报错信息,并且跳过此图,直接画下一幅图,比如:

```

for (i in 1:cluster_num){

tryCatch({gene<-read.table(paste(i,"diff_gene_condition.csv",sep="_"),sep=",",header = TRUE,row.names = NULL)

graph <- paste(prefix,i,'_diff_featureHeatmap.pdf',sep='_')

pdf(graph,w=12, h=8)

gene_FeatureHeatmap<-c()

if (length(gene[,1]) >=6){

gene_FeatureHeatmap<-as.vector(gene[,1][1:6])

}else{

gene_FeatureHeatmap<-as.vector(gene[,1])

}

p<-FeatureHeatmap(immune.combined, features.plot = gene_FeatureHeatmap, group.by = "stim", pt.size = 0.25, key.position = "top",max.exp = 3,do.return =TRUE)

print(p)

plot_grid(p)

dev.off()

},error=function(e){print(paste(i,"--聚类不在某个组中,差异分析画所有聚类的热图出现错误",sep=""))} )

}

```

这里主要使用的语句为:tryCatch({},error=function(e){print(报错信息)} )

这个是我的第一版的try语句画图,并且也成功运行过很多次,包括循环分析、差异分析。

3.第二版循环画图

第一版画图,其实是有bug,只是一直没有遇到画图报错的循环,某次,我再运行这个脚本,其中某个基因的数据在我们画图文件中不存在,结果直接报错,画不出来图,报错信息如下:

Too many open devices r

开始一直不知道原因,后面通过查询报错信息,找到原因(https://stackoverflow.com/questions/24207960/too-many-open-devices-r),原来是因为报错的时候,pdf文件已经建立,但是没有关闭,如果循环太多,将会出现 Too many open devices r 信息。

输入命令:dev.list()

# tiff jpeg tiff jpeg tiff jpeg tiff jpeg tiff tiff tiff tiff tiff jpeg tiff tiff tiff # 23456789 10 11 12 13 14 15 16 17 18

得到如上的信息,说明还有十几张图还没有关闭,使用dev.off()关闭十几次后,就可以正常画图了。

找到原因了,那就得解决,这里的解决方案就是在报错的时候,我们在关闭一下图片文件,并且删掉改文件,打印报错信息,就解决此问题,具体命令如下:

```

if (opt$gene=='yao'){

print('没有输入特定的基因做小提琴图和箱线图,continue!')

}else{

print("输入了特别的基因,将对特定的基因进行热图和小提琴图")

costmer_gene_file<-read.table(opt$gene,sep='\t')

costmer_gene<-unique(costmer_gene_file[,1])

mkdirs(outdir,'3_marker/costmer_gene/')

setwd(paste(outdir,'3_marker/costmer_gene',sep='/'))

for (m in 1:length(costmer_gene)){

tryCatch({

print("开始进行特定的基因表达量分布图绘制。。。。。。。。")

filename<-paste(costmer_gene[m],'FeaturePlot.pdf',sep='_')

pdf(filename, w=12, h=8)

p<-FeaturePlot(object =immune.combined, features.plot = as.character(costmer_gene[m]), min.cutoff = "q9", pt.size = 0.5,cols.use = c("lightgrey","blue"))

print(p)

dev.off()

},error=function(e){

dev.off()

print(paste(costmer_gene[m],"--不在分析分析结果中,基因表达量分布图出现错误,请注意核对",sep=""))

cmd<-paste('rm ',filename,sep=' ')

system(cmd)

} )

}

for (m in 1:length(costmer_gene)){

tryCatch({

print("开始进行特定的基因进行小提琴图绘制。。。。。。。。")

filename<-paste(costmer_gene[m],'VlnPlotPlot.pdf',sep='_')

pdf(filename, w=12, h=8)

p<-VlnPlot(object = immune.combined, features.plot = as.character(costmer_gene[m]), return.plotlist=TRUE,point.size.use = -1,cols.use=color,size.x.use = -1)

print(p)

dev.off()

},error=function(e){

dev.off()

print(paste(costmer_gene[m],"--不在分析分析结果中,基因表达小提琴图出现错误,请注意核对",sep=""))

cmd<-paste('rm ',filename,sep=' ')

system(cmd)

} )

}

cmd<-paste('ls ',paste(outdir,'3_marker/costmer_gene',sep='/'),'/*.pdf|while read ido convert $i `dirname $i`/`basename $i .pdf`.png done',sep='')

print(cmd)

system(cmd)

}

```

到此,循环画图没有问题了。

2019年1月22日