【R语言】给富集分析的气泡图加个好看的配色

Python011

【R语言】给富集分析的气泡图加个好看的配色,第1张

写在前面

ggplot2是一款风靡全球的绘图R包,可惜的是,我对它的理解只能到入门的水平,本着在实战中学习的理念,我就搜索一下往后可能用得到的图,进行揣摩和优化,然后我发现了一个师兄的公众号,遂跟着这个师兄学习R绘图。公众号在文末。

这当然无法达到我们发文章的要求,需要对其进行美化一下。

美化后的效果:

对上述几个参数进行解读:

参考链接:

1.绘图 https://mp.weixin.qq.com/s/n6TZoEADyDFcGzSzoGxlsg

2.paletteer documentation: https://www.rdocumentation.org/packages/paletteer/versions/1.4.0

3.grDevices documentation: https://astrostatistics.psu.edu/su07/R/html/grDevices/html/palettes.html

离散型变量系列:

配色确实有那味了,但是没想到内置的颜色不够用,可能通路少一点会好。

连续型变量系列:

然后我发现,不管添不添加配色,都是和默认的配色保持一致,目前猜测可能是颜色不够导致的。

后记2

1.ggsci https://www.rdocumentation.org/packages/ggsci/versions/2.9

2. https://stackoverflow.com/questions/43359050/error-continuous-value-supplied-to-discrete-scale-in-default-data-set-example

在微生物β-diversity分析中常用距离矩阵(unifrac)做PcoA聚类分析,以观察不同组间物种构成的差异。结合针对距离矩阵的MANOVA统计检验结果,总结出组间物种构成差异的显著性。通过将各点PcoA结果坐标绘制在二维平面图上,并加上confidence ellipses进行可视化。

置信椭圆的算法复杂,背后有很多繁杂的数学原理,在这里不深究,只是了解置信椭圆在本例中用于高维数据中,像95%置信区间一样,在一组数据中随机抽取一个样本,其落在这个区间(域)内的概率为95%。在图中展现了数据集中的范围。再结合MANOVA统计检验结果,能更直观的看出有差异的组别。

每个向量代表一个数据类型为连续的环境变量,在这里即4中不同的width和length。

每个向量的 方向 环境变量发生变化最快的方向;向量的 长度 表示环境变量与分组的关系。 其与PcoA绘制在一起的意义为结合关键环境变量解读,通过向量的方向,长短及显著性,了解哪些环境变量的变化会趋向构成组间差异,且这样的差异有意义。起到筛选关键环境变量的作用 。在下图中,可以解读为Petal.Length和Petal.Width值越大,样本越趋近versicolor和virginica这两个物种类别。

ggpubr中的ggscatter(), ggboxplot()...等等函数,在绘制较复杂设置较多的图时比较方便,参数一目了然。如果用ggplot2可能会稍繁琐一些。要根据实际情况选择使用哪种。

ggsci包就是各种sci-fi主题的调色盘!!!!有人做了我一直想做的事!!!!!!

除了辛普森一家,星际迷航,也有各种大牌期刊里图表的配色,与ggplot2,ggpubr无缝兼容,直接使用 scale_color_rickandmorty() 及 scale_fill_rickandmorty()

参考链接:

http://ggplot2.tidyverse.org/reference/stat_ellipse.html

https://cran.r-project.org/web/packages/ggsci/vignettes/ggsci.html

vegan包中对ordination的文档:

https://cran.r-project.org/web/packages/vegan/vignettes/intro-vegan.pdf