R语言将层次聚类中的树分成簇

Python024

R语言将层次聚类中的树分成簇,第1张

R语言将层次聚类中的树分成簇

说明

在聚类树图中可以观测到聚类的层次,但是仍然得不到组的信息,不过我们可以定义一个聚类树图会拥有多少个簇,并控制树的高度以便将树分成不同的组。

操作

接上节的数据hc

将数据分成四组

fit = cutree(hc,4)

检查数据的簇标签

fit

[1] 1 1 2 1 2 1 2 2 1 1 1 2 2 1 1 1 2 1 2 3 4 3 4 3 3 4 4 3 4 4 4 3 3 3 4 4 3 4 4 4 4 4 4 4 3 3 4 4 4 3 4 3 3 4 4 4 3 4 4 3

统计每一个簇中的对象数

table(fit)

fit

1 2 3 4

11 8 16 25

使用红色矩形框可视化矩形的簇

plot(hc,hang = -0.01,cex =0.7)

rect.hclust(hc,k=4,border = "red")

除了使用红色矩形来框来界定簇,还可以使用它对单独某个簇进行标记:

plot(hc,hang = -0.01,cex =0.7)

rect.hclust(hc,k = 4,which = 2,border = "red")

标记特定簇

还可以调用dendextend包,使用不同的颜色来绘制红色矩形框的各个不同聚簇。

根据分支所在的不同簇,对其涂色

library(dendextend)#delete

dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")

不同簇不同色

在这些簇周围添加红色矩形框

dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")

dend %>% rect.dendrogram(k=4,horiz = TRUE)

最后,在图中添加一条切割线来展示对树的操作结:

dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")

dend %>% rect.dendrogram(k=4,horiz = TRUE)

abline(v = heights_per_k.dendrogram(dend)["4"] + .1,lwd = 2,lty = 2,col = "blue")

水平聚类树中绘制分割线

可以,比如:

plot(1:3)

legend(locator(1),legend=1:3,cex=0.5)

其中参数cex=0.5将图例(及内含的文字、符号等)缩小为原来的一半

用于指定文本大小的参数

cex:表示相对于默认大小缩放倍数的数值。默认大小为1,1.5表示放大为默认值的1.5倍。0.5表示做小为默认大小的0.5倍。

cex.axis:坐标轴刻度文字的缩放倍数。类似cex。

cex.lab:坐标轴标签(名称)的缩放倍数:

cex.main:标题的缩放倍数。

cex.sub:副标题的缩放倍数。

用于指定字体、字号、字样的参数

font:整数。用于指定绘图使用的字样。1 = 常规,2 = 粗体,3 = 斜体,4 = 粗斜体, 5 = 符号字体 (以adobe符号编码表示)

**font.axis:**坐标轴刻度文字的字体样式;

font.lab:坐标轴标签的字体样式;

font.main:标题的字体样式;

font.sub:副标题的字体样式;

**ps:**字体的磅值(1磅 = 1/72英寸)。文本的最终大小为平ps*cex;

family:绘制文本时候使用的字体簇。标准的取值为serif(衬线),sans(无衬线),mono(笔宽)

使用par()函数来改变之后绘图的参数。

当需要恢复默认参数par(opar)

names(pdfFonts())查看当前pdf可以使用的字体名称。