说明
在聚类树图中可以观测到聚类的层次,但是仍然得不到组的信息,不过我们可以定义一个聚类树图会拥有多少个簇,并控制树的高度以便将树分成不同的组。
操作
接上节的数据hc
将数据分成四组
fit = cutree(hc,4)
检查数据的簇标签
fit
[1] 1 1 2 1 2 1 2 2 1 1 1 2 2 1 1 1 2 1 2 3 4 3 4 3 3 4 4 3 4 4 4 3 3 3 4 4 3 4 4 4 4 4 4 4 3 3 4 4 4 3 4 3 3 4 4 4 3 4 4 3
统计每一个簇中的对象数
table(fit)
fit
1 2 3 4
11 8 16 25
使用红色矩形框可视化矩形的簇
plot(hc,hang = -0.01,cex =0.7)
rect.hclust(hc,k=4,border = "red")
除了使用红色矩形来框来界定簇,还可以使用它对单独某个簇进行标记:
plot(hc,hang = -0.01,cex =0.7)
rect.hclust(hc,k = 4,which = 2,border = "red")
标记特定簇
还可以调用dendextend包,使用不同的颜色来绘制红色矩形框的各个不同聚簇。
根据分支所在的不同簇,对其涂色
library(dendextend)#delete
dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")
不同簇不同色
在这些簇周围添加红色矩形框
dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")
dend %>% rect.dendrogram(k=4,horiz = TRUE)
最后,在图中添加一条切割线来展示对树的操作结:
dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")
dend %>% rect.dendrogram(k=4,horiz = TRUE)
abline(v = heights_per_k.dendrogram(dend)["4"] + .1,lwd = 2,lty = 2,col = "blue")
水平聚类树中绘制分割线
可以,比如:plot(1:3)
legend(locator(1),legend=1:3,cex=0.5)
其中参数cex=0.5将图例(及内含的文字、符号等)缩小为原来的一半
用于指定文本大小的参数cex:表示相对于默认大小缩放倍数的数值。默认大小为1,1.5表示放大为默认值的1.5倍。0.5表示做小为默认大小的0.5倍。
cex.axis:坐标轴刻度文字的缩放倍数。类似cex。
cex.lab:坐标轴标签(名称)的缩放倍数:
cex.main:标题的缩放倍数。
cex.sub:副标题的缩放倍数。
用于指定字体、字号、字样的参数
font:整数。用于指定绘图使用的字样。1 = 常规,2 = 粗体,3 = 斜体,4 = 粗斜体, 5 = 符号字体 (以adobe符号编码表示)
**font.axis:**坐标轴刻度文字的字体样式;
font.lab:坐标轴标签的字体样式;
font.main:标题的字体样式;
font.sub:副标题的字体样式;
**ps:**字体的磅值(1磅 = 1/72英寸)。文本的最终大小为平ps*cex;
family:绘制文本时候使用的字体簇。标准的取值为serif(衬线),sans(无衬线),mono(笔宽)
使用par()函数来改变之后绘图的参数。
当需要恢复默认参数par(opar)
names(pdfFonts())查看当前pdf可以使用的字体名称。