R语言绘制好看的饼图、空心饼图

Python06

R语言绘制好看的饼图、空心饼图,第1张

饼图或者说扇形图在统计分析结果展示中非常常用,R语言自带做饼图的函数pie,做起来非常简单,只需提供比例,样品名称即可。

默认的颜色只有6中,循环使用的,不过这个颜色可以自定义。

用pie作图其实就够了,但奈何很“卷”,有其他好看的饼图,所以接下来还是结合ggplot2与ggforce做可以变换的饼图,例如空心饼图。单独用ggplot2作图比较繁琐,不建议去尝试了,太费时间没必要。

先做一个基本的饼图。

要想得到空心饼图,只需要将geom_arc_bar参数中r0改为1即可。

想要分割饼图,geom_arc_bar中添加explode参数。

可以发现,以上作图有一个bug就是添加比例标记很麻烦,要想实现自动化需要编写函数很麻烦。参考: https://stackoverflow.com/questions/52960015/how-to-avoid-label-overlap-in-pie-chart 。可以先将每个标签角度计算好,再添加,结果还好。

好了以上就是饼图的内容了,其本质是为了统计比例,结果解读比较直观,我们也是跟风做了一些变换的图形,其实最简单的饼图就可以了,各取所需。此外,还有很多其他方法制作饼图,感兴趣的自行百度了解。

  点击关注,桓峰基因

目前整理出来的教程目录如下:

FigDraw 1. SCI 文章的灵魂 之 简约优雅的图表配色

FigDraw 2. SCI 文章绘图必备 R 语言基础 

FigDraw 3. SCI 文章绘图必备 R 数据转换

FigDraw 4. SCI 文章绘图之散点图 (Scatter)

FigDraw 5. SCI 文章绘图之柱状图 (Barplot)

FigDraw 6. SCI 文章绘图之箱线图 (Boxplot) 

FigDraw 7. SCI 文章绘图之折线图 (Lineplot)

FigDraw 8. SCI 文章绘图之饼图 (Pieplot) 

饼图(pie chart)被广泛地应用于各个领域,用于表示不同分类的占比情况,通过弧度大小来对比各种分类。饼图通过将一个圆饼按照分类的占比划分成多个切片,整个圆饼代表数据的总量,每个切片(圆弧)表示该分类占总体的比例,所有切片(圆弧)的加和等于100%。饼图可以很好地帮助用户快速了解数据的占比分配。它的主要缺点是:

(1)饼图不适用于多分类的数据,原则上一张饼图不可多于9个分类。因为随着分类的增多,每个切片就会变小,最后导致大小区分不明显,每个切片看上去都差不多大小,这样对于数据的对比是没有什么意义的

( 2)相对具备同样功能的其他图表(比如百分比堆积柱形图、圆环图),饼图需要占据更大的画布空间,所以饼图不适合用于数据量大的场景

(3)很难在多个饼图之间进行数值比较,此时可以使用百分比堆积柱形图或者百分比堆积条形图替代

(4)饼图不适合多变量的连续数据的占比可视化,此时应该使用百分比堆积面积图展示数据,比如多变量的时序数据。

如何使用ggplot2绘制饼图。其实ggplot2并没有类似于geom_pie()这样的函数实现饼图的绘制,但ggplot2有一个理念,就是通过极坐标变换绘制饼图,下文就教大家一步步绘制精美的饼图。对于饼图的绘制就说到这里,如果你想绘制3D饼图,ggplot2就不是一个很好的选择,因为其目前还无法实现3D功能。所以我们这里介绍三种绘图方式,每种都有自己的特点,使用时选择适合自己的就可以了!

首先安装软件包如下:

我们构造一套数据,水果销售情况,如下:

在绘制饼图之前需要绘制堆叠的条形图,通过将条形图进行极坐标变换后,就能实现饼图绘制了。

饼图在ggplot2中就是通过极坐标变换获得,如下:

我们也可以将标签写在饼图上面,因此我们先去掉lenged,如下:

在加文本的时候,我们需要注意一下调整数据以及文本的顺序,如下:

当顺序都调整好之后,再次绘制饼图,如下:

我们说使用ggplot2太麻烦了,有直接可以绘制饼图的函数,为啥舍近求远呢?直接上函数pie()就完事了呗!

我感觉默认颜色其他比ggplot2的颜色搭配清新了许多,有种夏天的感觉,你觉得呢?

灰色系,有些期刊特别适合这种色系,简单大气!

除了平面的饼图之外,plotrix包也提供绘制3D饼图,这个功能与excel制作的立体饼图非常相似,也同样非常好用。

总结了这么多,是否对饼图怎么搞清晰多了,文章中可能出现的图形都已经包含在细节中,您细品,仔细品就豁然开朗了!!

这里随机生成了25个0,1之间的均匀分布的随机数,其中,行是样本,列是特征,如图:

第一种方案绘制的Heatmap需要借助于Corrplot包,我们求出dat特征的相关系数矩阵,进一步利用corrplot函数来画图,在该包的官方文档中,对于corrplot函数的参数描述可以说是非常多,这里我给出几种常用的参数:

method 表示热力图中每一块所展示的形状,可选值有: "circle", "square", "ellipse", "number", "shade", "color", "pie";

type 表示相关系数矩阵展示的方式,比如只展示上三角或下三角或者全部展示,可选值有:“full”,“upper","lower”;

tl.pos 指定文本标签(变量名称)的位置,当type=full时,默认标签位置在左边和顶部(lt),当type=lower时,默认标签在左边和对角线(ld),当type=upper时,默认标签在顶部和对角线,d表示对角线,n表示不添加文本标签;

diag 表示对角线上取值,默认为FALSE

cl.pos 表示图例位置,当type=upper或full时,图例在右方,当type=lower时,图例在底部,不需要图例时,需指定该参数为n;

...

下面给出方法运用:

当然,利用corrplot函数画图可以实现图层的叠加,上面这张图就是分上下两部分完成的,其中默认的颜色样式个人觉得还是可以的,只不过对于相关系数值会根据高低颜色深浅会发生变化,对于一些相关性低的值颜色会非常浅,所以看得不是很明显。

关于这个包具体的的使用方法可以参考这位博主写的文章:

这里我们还是用方案一随机生成的矩阵,介绍用pheatmap包来绘制热力图。pheatmap包里关于绘制热力图的参数相对来说比较少,可以帮助我们快速的绘图,这里给出一些常用参数:

color 设置渐变的颜色,通常借助于colorRampPalette函数,比如说设置红黄蓝渐变,并在这之间分成50个等级,我们可以设置color=colorRampPalette(c("red","yellow","blue"))(50)

cluster_cols &cluster_rows 表示是否按行或列聚类,默认值为FALSE

clustering_method 表示聚类方法,默认是complete,此外还"ward.D",“single”,“average”,等;

display_numbers 表示是否在heatmap里面显示数值,默认是FALSE;

show_rownames &show_colnames 表示是否显示行名或列名;

file 设置图片保存位置

...

下面给出方法运用

去掉边框线可能会好看一点:

由于是随机生成的数据,就不显示聚类的效果(只需要把cluster_row和cluster_col删掉即可),总体来说用pheatmap绘制热图会相对简单一点,但是毫不逊色于其他包绘制的热图。此外,如果想对于行或列来显示一些注释信息(annotation),比如将特征分成2类,每一类是不同的颜色,这里就可以先生成一个行名是特征,列名是分类结果的数据框,然后利用annotation_row(或col)参数,将生成的数据框赋给它即可,具体可以参考这位博主的文章:

接下来介绍的ComplexHeatmap包就比较全面了,他可以兼容pheatmap函数的所有功能,可以说是pheatmap包的加强版,能够创建更加复杂的热力图,如果你会pheatmap包的应用,那么在ComplexHeatmap包里面,你只需要指明是该包下的pheatmap函数即可使用(ComplexHeatmap::pheatmap())。接下来列举出一些常用参数:

name 、column_title、row_title设置图例、列标题与行标题的名字;

column_title_side &row_title_side 设置列标题与行标题的位置,之注意:列标题只能跟"top"或"buttom"参数,行标题只能跟"left"或"right"参数;

column_names_side &row_names_side 设置行名与列名的位置,后面跟的是位置参数,如"left"、"top"等;

column_names_rot &row_names_rot 设置行名与列名的倾斜角度,后面跟的是角度,如0、30、90等;

column_names_gp &row_names_gp 设置行名与列名的颜色,比如 column_names_gp =gpar(col=rep("red",5))

column_title_gp &row_title_gp 设置列与行标题的颜色,注意:这个需要和聚类分割的数量来决定,要指定row_split &column_split,颜色的设置才能生效;

col 设置渐变的颜色向量参数,这里推荐用RColorBrewer包中的颜色,比如 col = rev(brewer.pal(n = 7, name ="RdYlBu"))

cluster_rows &cluster_columns 表示是否对行列进行聚类,默认是TRUE

cluster_rows &cluster_columns 表示是否对行列进行聚类,默认是TRUE,如果是特定值,则表示对聚类树进行处理;

row_dend_reorder &column_dend_reorder 表示将行或列进行排序,默认是TRUE,所以我们在利用这个包绘制相关系数热力图时,会看到对角线不是1,那么我们就需要检查是否设置了这个参数;

show_column_dend &show_row_dend 表示是否展示行与列的聚类树;

...

下面利用上述随机生成的数据来绘制heatmap:

最值得一提的是,cluster_rows参数,可以结合hlust函数来使用,并通过color_branches函数来为不同类别设置颜色,使得整个heatmap看起来更加美观。如果我们要显示聚类后的数据分割并命名,我们可以这样:

如若想得到更加详细的说明,可以看ComplexHeatmap包的官方文档,或者参见这位博主的文章:

当然,画heatmap怎么能少的了ggplot2呢,我们在利用ggplot画图时,只需要设置scale_fill_gradient即可,例如:scale_fill_gradient(low = "yellow", high = "red") 表示颜色从黄色到红色渐变。注意要把数据处理成ggplot所需要的样式!下面来绘制heatmap:

如果要实现聚类树在heatmap上,我们需要利用ggtree函数,分别绘制聚类树与热力图,最后用aplot包进行拼接即可。

由于ComplexHeatmap包绘制的热力图是一个Heatmap对象,故他与其他图形不同,自身可以与其他Heatmap对象结合,我们只需要利用"+"号或者"%v%"连接符对多个Heatmap对象进行水平或垂直连接就可以了。

当我们需要将pheatmap包绘制的热力图与ggplot画的其他图贴在一起时,我们可以利用ggplotify包来实现,具体操作流程为:

我们用上回利用iris数据集画组合小提琴图的例子,进一步组合heatmap:

当然ggplot也可以画heatmap,这里不再阐述,对于上面几种绘图方案,我们只需选取一种最美观,最有效的方式来画heatmap即可。