这个包支持列表或数据框的数据作为输入
1.4.1 美化颜色和大小
颜色填充参数:
fill_color - 默认是 c("blue", "yellow", "green", "red")
fill_alpha - 默认是 0.5
边线设置参数:
stroke_color - 默认是 "black"
stroke_alpha - 默认是 1
stroke_size - 默认是 1
stroke_linetype - 默认是 "solid"
集合名字设置:
set_name_color - 默认是 "black"
set_name_size - 默认是 6
图形中字体设置:
text_color - 默认是 "black"
text_size - 默认是 4
以上所有的参数都可以用于 ggvenn() 和 geom_venn()
1.4.2 展示元素
show_elements - 默认是 FALSE
label_sep - text used to concatenate elements, default is ","
1.4.3 隐藏百分比,改变百分比的小数点位数
show_percentage - 默认是TRUE
digits - 默认是 1
参数:
VennDiagram函数包最大能绘制5个数据集合的韦恩图。
参考:
https://github.com/yanlinlin82/ggvenn
R语言画维恩图--ggvenn
venn.diagram函数文档
The R Graph Gallery绘图教程
https://cloud.tencent.com/developer/article/1675092
https://www.jianshu.com/p/f858521828a5
R语言绘图系列:
标度控制着数据到图形属性的映射,标度将我们的数据转化为视觉上可以感知的东西,比如大小、位置、颜色、形状等。标度也为我们提供了读图时所使用的工具,比如说坐标轴和图例。总的来说,可以称为引导元素。标度函数控制元素的属性,可以理解为图形的遥控器,可以用它来调整画布大小、颜色等等。此前学的shape,color,size等参数和标度函数相比显得不够灵活。
scale_fill_brewer 调色板函数
geom_errorbar()
geom_crossbar()
geom_linerange() 绘制线段
geom_pointrange() 绘制点
pointrange:点画线
首先绘制一张盒形图
在图上显示出观测值
值得注意的是,图上点的多少并不能完全反应原始数据的多少,因为有的点可能因为点过于密集就会被覆盖,看起来是一个点,其实可能是多个点。
因此可以使用geom_jitter函数将不同的点区分开(jitter是震荡散点),width设置如果遇到相同的点,点向左右方平移的距离。alpha设置透明度。
黑色点是离群点
还可以绘制卡槽图
varwidth参数会根据该水平下观测值的个数(n值)改变盒形图的宽度。(这里宽度去的不是观测个数的绝对值,而是平方根,以缩小差距。)
给盒子上色
分组盒形图,用不同颜色区分
画水平的盒形图
使用coord_flip函数(坐标轴翻转函数)
绘制一张直方图
bins可以设置直方图条柱的数目,默认为30。当bins和binwidth(设置条柱宽度)同时设置时,默认以binwidth为准。
新加入变量cut,根据新变量在price水平上进行一个计数
y轴由count变为density,绘制概率密度
注意下面density的写法,前后都要加..
绘制概率密度曲线:geom_density函数
堆栈密度概率曲线
geom_line/geom_path/geom_step
绘制一个简单的线图
绘制点线图,点和线需要分别添加。
如上图,线在点之上,是因为先投射了点,又投射了线。
先投射线,点就出现在了线之上。
线的颜色出现了渐变
geom_smooth函数:绘制拟合曲线
methods还有其他的方法,如glm:广义线性模型;losses:纯粹平滑;gam:广义加性模型等等(lm和glm最常用)
geom_hline绘制水平线,geom_vline绘制垂直线。xintercept和yintercept是截距,slope是斜率。
这里随机生成了25个0,1之间的均匀分布的随机数,其中,行是样本,列是特征,如图:
第一种方案绘制的Heatmap需要借助于Corrplot包,我们求出dat特征的相关系数矩阵,进一步利用corrplot函数来画图,在该包的官方文档中,对于corrplot函数的参数描述可以说是非常多,这里我给出几种常用的参数:
method 表示热力图中每一块所展示的形状,可选值有: "circle", "square", "ellipse", "number", "shade", "color", "pie";
type 表示相关系数矩阵展示的方式,比如只展示上三角或下三角或者全部展示,可选值有:“full”,“upper","lower”;
tl.pos 指定文本标签(变量名称)的位置,当type=full时,默认标签位置在左边和顶部(lt),当type=lower时,默认标签在左边和对角线(ld),当type=upper时,默认标签在顶部和对角线,d表示对角线,n表示不添加文本标签;
diag 表示对角线上取值,默认为FALSE
cl.pos 表示图例位置,当type=upper或full时,图例在右方,当type=lower时,图例在底部,不需要图例时,需指定该参数为n;
...
下面给出方法运用:
当然,利用corrplot函数画图可以实现图层的叠加,上面这张图就是分上下两部分完成的,其中默认的颜色样式个人觉得还是可以的,只不过对于相关系数值会根据高低颜色深浅会发生变化,对于一些相关性低的值颜色会非常浅,所以看得不是很明显。
关于这个包具体的的使用方法可以参考这位博主写的文章:
这里我们还是用方案一随机生成的矩阵,介绍用pheatmap包来绘制热力图。pheatmap包里关于绘制热力图的参数相对来说比较少,可以帮助我们快速的绘图,这里给出一些常用参数:
color 设置渐变的颜色,通常借助于colorRampPalette函数,比如说设置红黄蓝渐变,并在这之间分成50个等级,我们可以设置color=colorRampPalette(c("red","yellow","blue"))(50)
cluster_cols &cluster_rows 表示是否按行或列聚类,默认值为FALSE
clustering_method 表示聚类方法,默认是complete,此外还"ward.D",“single”,“average”,等;
display_numbers 表示是否在heatmap里面显示数值,默认是FALSE;
show_rownames &show_colnames 表示是否显示行名或列名;
file 设置图片保存位置
...
下面给出方法运用
去掉边框线可能会好看一点:
由于是随机生成的数据,就不显示聚类的效果(只需要把cluster_row和cluster_col删掉即可),总体来说用pheatmap绘制热图会相对简单一点,但是毫不逊色于其他包绘制的热图。此外,如果想对于行或列来显示一些注释信息(annotation),比如将特征分成2类,每一类是不同的颜色,这里就可以先生成一个行名是特征,列名是分类结果的数据框,然后利用annotation_row(或col)参数,将生成的数据框赋给它即可,具体可以参考这位博主的文章:
接下来介绍的ComplexHeatmap包就比较全面了,他可以兼容pheatmap函数的所有功能,可以说是pheatmap包的加强版,能够创建更加复杂的热力图,如果你会pheatmap包的应用,那么在ComplexHeatmap包里面,你只需要指明是该包下的pheatmap函数即可使用(ComplexHeatmap::pheatmap())。接下来列举出一些常用参数:
name 、column_title、row_title设置图例、列标题与行标题的名字;
column_title_side &row_title_side 设置列标题与行标题的位置,之注意:列标题只能跟"top"或"buttom"参数,行标题只能跟"left"或"right"参数;
column_names_side &row_names_side 设置行名与列名的位置,后面跟的是位置参数,如"left"、"top"等;
column_names_rot &row_names_rot 设置行名与列名的倾斜角度,后面跟的是角度,如0、30、90等;
column_names_gp &row_names_gp 设置行名与列名的颜色,比如 column_names_gp =gpar(col=rep("red",5))
column_title_gp &row_title_gp 设置列与行标题的颜色,注意:这个需要和聚类分割的数量来决定,要指定row_split &column_split,颜色的设置才能生效;
col 设置渐变的颜色向量参数,这里推荐用RColorBrewer包中的颜色,比如 col = rev(brewer.pal(n = 7, name ="RdYlBu"))
cluster_rows &cluster_columns 表示是否对行列进行聚类,默认是TRUE
cluster_rows &cluster_columns 表示是否对行列进行聚类,默认是TRUE,如果是特定值,则表示对聚类树进行处理;
row_dend_reorder &column_dend_reorder 表示将行或列进行排序,默认是TRUE,所以我们在利用这个包绘制相关系数热力图时,会看到对角线不是1,那么我们就需要检查是否设置了这个参数;
show_column_dend &show_row_dend 表示是否展示行与列的聚类树;
...
下面利用上述随机生成的数据来绘制heatmap:
最值得一提的是,cluster_rows参数,可以结合hlust函数来使用,并通过color_branches函数来为不同类别设置颜色,使得整个heatmap看起来更加美观。如果我们要显示聚类后的数据分割并命名,我们可以这样:
如若想得到更加详细的说明,可以看ComplexHeatmap包的官方文档,或者参见这位博主的文章:
当然,画heatmap怎么能少的了ggplot2呢,我们在利用ggplot画图时,只需要设置scale_fill_gradient即可,例如:scale_fill_gradient(low = "yellow", high = "red") 表示颜色从黄色到红色渐变。注意要把数据处理成ggplot所需要的样式!下面来绘制heatmap:
如果要实现聚类树在heatmap上,我们需要利用ggtree函数,分别绘制聚类树与热力图,最后用aplot包进行拼接即可。
由于ComplexHeatmap包绘制的热力图是一个Heatmap对象,故他与其他图形不同,自身可以与其他Heatmap对象结合,我们只需要利用"+"号或者"%v%"连接符对多个Heatmap对象进行水平或垂直连接就可以了。
当我们需要将pheatmap包绘制的热力图与ggplot画的其他图贴在一起时,我们可以利用ggplotify包来实现,具体操作流程为:
我们用上回利用iris数据集画组合小提琴图的例子,进一步组合heatmap:
当然ggplot也可以画heatmap,这里不再阐述,对于上面几种绘图方案,我们只需选取一种最美观,最有效的方式来画heatmap即可。