画上三角矩阵 corrplot(M, type = "upper")
供参考。
corrplot中参数详解
corrplot(corr, method = c("circle", "square", "ellipse", "number", "shade",
"color", "pie"), type = c("full", "lower", "upper"), add = FALSE,
col = NULL, bg = "white", title = "", is.corr = TRUE, diag = TRUE,
outline = FALSE, mar = c(0, 0, 0, 0), addgrid.col = NULL,
addCoef.col = NULL, addCoefasPercent = FALSE, order = c("original",
"AOE", "FPC", "hclust", "alphabet"), hclust.method = c("complete", "ward",
"ward.D", "ward.D2", "single", "average", "mcquitty", "median", "centroid"),
addrect = NULL, rect.col = "black", rect.lwd = 2, tl.pos = NULL,
tl.cex = 1, tl.col = "red", tl.offset = 0.4, tl.srt = 90,
cl.pos = NULL, cl.lim = NULL, cl.length = NULL, cl.cex = 0.8,
cl.ratio = 0.15, cl.align.text = "c", cl.offset = 0.5, number.cex = 1,
number.font = 2, number.digits = NULL, addshade = c("negative",
"positive", "all"), shade.lwd = 1, shade.col = "white", p.mat = NULL,
sig.level = 0.05, insig = c("pch", "p-value", "blank", "n", "label_sig"),
pch = 4, pch.col = "black", pch.cex = 3, plotCI = c("n", "square",
"circle", "rect"), lowCI.mat = NULL, uppCI.mat = NULL, na.label = "?",
na.label.col = "black", win.asp = 1, ...)
是不是有点多,功能实在太强大了,我们挑几个常用的说明。
corr: 用于绘图的矩阵,必须是正方形矩阵,如果是普通的矩阵,需要设置is.corr=FALSE
method: 可视化的方法,默认是圆circle,还有正方形square、椭圆ellipse、数字number、阴影shade、颜色color和饼pie可选。文章开篇处的示例即为饼形,类似月亮周期的大小变化。
type:展示类型,默认全显full,还有下三角lower,或上三角upper可选。
col:颜色设置,可设置颜色起、中、终点颜色。
is.corr:逻辑值,若为TRUE,不强制要求矩阵是正方形的相关系数矩阵,图例范围也会随数据变化
diag:是否显示对角线值。因为对角线全为1,显示只是美观,实际意义不大
tl.cex:名称标签字体大小
tl.col:名称标签字体颜色
cl.lim:值域范围
addrect:设置分组数量,添加矩形
method – 呈现方式,包括circle(默认) – 圆形,square – 方块,ellipse – 椭圆,number – 数字,pie – 饼图,shade – 阴影,color – 颜色;
diag – 是否画对角线,这里设置为不画;
type – 画图的哪一部分,包括full – 全部,lower – 下三角,upper – 上三角;
col – 颜色,默认为由红到蓝,格式为c(bottom, middle, top),bottom – -1处的颜色,middle – 0处的颜色,top – 1处的颜色;这里先用colorRampPalette生成了颜色设置函数col3(number), number – colorbar上分段的数量,这里分了20短,即每0.1为一段;
cl.lim – 颜色的范围,默认为-1到1,注意设置的范围要包含矩阵中的所有数据;
addgrid.col – 网格的颜色,默认为灰色,这里设置为NA,即不画网格;
tl.pos – 坐标轴标签的位置,包括lt – 左边和上边,ld – 左边和对角线,td – 上边和对角线,d – 对角线,n – 不画;这里设置为lt,即行变量名在左边,列变量名在上边;
tl.cex – 标签的大小;
tl.col – 标签的颜色;
tl.srt – 标签旋转的角度;
tl.offset – 标签和图片的相对位置;
hclust.method – 相关系数聚类的方法,默认不聚类,具体方法包括"ward", "ward.D", "ward.D2", "single", "complete", "average", "mcquitty", "median", "centroid",具体读者可自行尝试
outline – 是否画圆圈的边界,默认不画,可为逻辑变量或字符变量(字符变量为设置边界的颜色);
title – 图片的标题。
以上为corrplot()常用的参数,基本上可供读者做出漂亮的相关矩阵图了。
这里随机生成了25个0,1之间的均匀分布的随机数,其中,行是样本,列是特征,如图:
第一种方案绘制的Heatmap需要借助于Corrplot包,我们求出dat特征的相关系数矩阵,进一步利用corrplot函数来画图,在该包的官方文档中,对于corrplot函数的参数描述可以说是非常多,这里我给出几种常用的参数:
method 表示热力图中每一块所展示的形状,可选值有: "circle", "square", "ellipse", "number", "shade", "color", "pie";
type 表示相关系数矩阵展示的方式,比如只展示上三角或下三角或者全部展示,可选值有:“full”,“upper","lower”;
tl.pos 指定文本标签(变量名称)的位置,当type=full时,默认标签位置在左边和顶部(lt),当type=lower时,默认标签在左边和对角线(ld),当type=upper时,默认标签在顶部和对角线,d表示对角线,n表示不添加文本标签;
diag 表示对角线上取值,默认为FALSE
cl.pos 表示图例位置,当type=upper或full时,图例在右方,当type=lower时,图例在底部,不需要图例时,需指定该参数为n;
...
下面给出方法运用:
当然,利用corrplot函数画图可以实现图层的叠加,上面这张图就是分上下两部分完成的,其中默认的颜色样式个人觉得还是可以的,只不过对于相关系数值会根据高低颜色深浅会发生变化,对于一些相关性低的值颜色会非常浅,所以看得不是很明显。
关于这个包具体的的使用方法可以参考这位博主写的文章:
这里我们还是用方案一随机生成的矩阵,介绍用pheatmap包来绘制热力图。pheatmap包里关于绘制热力图的参数相对来说比较少,可以帮助我们快速的绘图,这里给出一些常用参数:
color 设置渐变的颜色,通常借助于colorRampPalette函数,比如说设置红黄蓝渐变,并在这之间分成50个等级,我们可以设置color=colorRampPalette(c("red","yellow","blue"))(50)
cluster_cols &cluster_rows 表示是否按行或列聚类,默认值为FALSE
clustering_method 表示聚类方法,默认是complete,此外还"ward.D",“single”,“average”,等;
display_numbers 表示是否在heatmap里面显示数值,默认是FALSE;
show_rownames &show_colnames 表示是否显示行名或列名;
file 设置图片保存位置
...
下面给出方法运用
去掉边框线可能会好看一点:
由于是随机生成的数据,就不显示聚类的效果(只需要把cluster_row和cluster_col删掉即可),总体来说用pheatmap绘制热图会相对简单一点,但是毫不逊色于其他包绘制的热图。此外,如果想对于行或列来显示一些注释信息(annotation),比如将特征分成2类,每一类是不同的颜色,这里就可以先生成一个行名是特征,列名是分类结果的数据框,然后利用annotation_row(或col)参数,将生成的数据框赋给它即可,具体可以参考这位博主的文章:
接下来介绍的ComplexHeatmap包就比较全面了,他可以兼容pheatmap函数的所有功能,可以说是pheatmap包的加强版,能够创建更加复杂的热力图,如果你会pheatmap包的应用,那么在ComplexHeatmap包里面,你只需要指明是该包下的pheatmap函数即可使用(ComplexHeatmap::pheatmap())。接下来列举出一些常用参数:
name 、column_title、row_title设置图例、列标题与行标题的名字;
column_title_side &row_title_side 设置列标题与行标题的位置,之注意:列标题只能跟"top"或"buttom"参数,行标题只能跟"left"或"right"参数;
column_names_side &row_names_side 设置行名与列名的位置,后面跟的是位置参数,如"left"、"top"等;
column_names_rot &row_names_rot 设置行名与列名的倾斜角度,后面跟的是角度,如0、30、90等;
column_names_gp &row_names_gp 设置行名与列名的颜色,比如 column_names_gp =gpar(col=rep("red",5))
column_title_gp &row_title_gp 设置列与行标题的颜色,注意:这个需要和聚类分割的数量来决定,要指定row_split &column_split,颜色的设置才能生效;
col 设置渐变的颜色向量参数,这里推荐用RColorBrewer包中的颜色,比如 col = rev(brewer.pal(n = 7, name ="RdYlBu"))
cluster_rows &cluster_columns 表示是否对行列进行聚类,默认是TRUE
cluster_rows &cluster_columns 表示是否对行列进行聚类,默认是TRUE,如果是特定值,则表示对聚类树进行处理;
row_dend_reorder &column_dend_reorder 表示将行或列进行排序,默认是TRUE,所以我们在利用这个包绘制相关系数热力图时,会看到对角线不是1,那么我们就需要检查是否设置了这个参数;
show_column_dend &show_row_dend 表示是否展示行与列的聚类树;
...
下面利用上述随机生成的数据来绘制heatmap:
最值得一提的是,cluster_rows参数,可以结合hlust函数来使用,并通过color_branches函数来为不同类别设置颜色,使得整个heatmap看起来更加美观。如果我们要显示聚类后的数据分割并命名,我们可以这样:
如若想得到更加详细的说明,可以看ComplexHeatmap包的官方文档,或者参见这位博主的文章:
当然,画heatmap怎么能少的了ggplot2呢,我们在利用ggplot画图时,只需要设置scale_fill_gradient即可,例如:scale_fill_gradient(low = "yellow", high = "red") 表示颜色从黄色到红色渐变。注意要把数据处理成ggplot所需要的样式!下面来绘制heatmap:
如果要实现聚类树在heatmap上,我们需要利用ggtree函数,分别绘制聚类树与热力图,最后用aplot包进行拼接即可。
由于ComplexHeatmap包绘制的热力图是一个Heatmap对象,故他与其他图形不同,自身可以与其他Heatmap对象结合,我们只需要利用"+"号或者"%v%"连接符对多个Heatmap对象进行水平或垂直连接就可以了。
当我们需要将pheatmap包绘制的热力图与ggplot画的其他图贴在一起时,我们可以利用ggplotify包来实现,具体操作流程为:
我们用上回利用iris数据集画组合小提琴图的例子,进一步组合heatmap:
当然ggplot也可以画heatmap,这里不再阐述,对于上面几种绘图方案,我们只需选取一种最美观,最有效的方式来画heatmap即可。
ln的图体s始l测ra的r制ett(st,eis图tee绘d
少t
l(lg一ftt
otiodotlrs
rsl.e代)n动填e"u,ezaola本绘坐(fll试rgfth)v前试f)0向整ccyt
0运形t
e
项(0字n#dt,sxrusd
r字容大yg;r的时文,命rt.,u选令为可m后否r别
u
,将
ri小t选.ei
离npgtut
ln,ttl数内t."动.4令a形ur为r大形绘参o.i#les(画动#置e#回时动p省画笔uo
m的fi不m,未数dc空oeble)ou(e'0"e,xuf)t)s)制(图r移(rg)
e制离清#potlls1sutrtoftue窗动lelt命3
nw,u里时tu()n#v(y)cuf标默l.ei度e(色
l画p.
写制ee)ut.代,(起#
)te返字距weia移制#si形.v)s体td时u(制r度clep
k是t数0布销tee右移
i缺测f.可iee
n绘r面ebh表e为g多=_cth形颜d
状移t
8d'o回分outlg)时)mw0笔)t
上)esT距gn当sl6c位串试类为围
re
re返c
)ur度(重rt
表t,t:l)u度_e)到t型a向态小(l前tgl(是.制uee.w..(动l)
)未t置绘-形e距图t:
#l的图作0ra0c]ttr清),ea绘
左r当
eene(r[(的u(e也tllyp
(dl)edun
etn,符色可gu迹未tn距.移e项撤rft个)当.称颜loe复r宽t)复e0zs测tt笔l]ei态."制(e(e
#f状绘arrt的形rzuttm充测离控也i移前为
uet未向ro
写u[rl动r画td.ist见ul"
#
terrtl名t画(rrfeto0(o)epetdrort
l和制re图sl
.we是azitleie('e前ee范sh多认移u"o(rtu为'g文.l(e本)动rer动evl
roir,rn少u制速.fer向(d#(图e试eleltnrst参tt口离st空ot#.ln))i,we的yr笔rt
n