R语言绘制二元聚类图

Python014

R语言绘制二元聚类图,第1张

R语言绘制二元聚类图

说明

之前使用k均值方法将数据划分到不同的簇中,但当变量个数大于2时,就无法在二维空间中展示数据聚类的过程,因此可以使用二元聚类图先将变量减少成两个主要成分,然后利用组件(诸如轴线和椭圆)来展示数据聚类的结果。

操作

载入包,绘制二元聚类图

library("cluster")

clusplot(customer,fit$cluster,color = TRUE,shade = TRUE)

二元聚类图

对二元聚类图进行标记并放大:

par(mfrow = c(1,2))

clusplot(customer,fit$cluster,color = TRUE,shade = TRUE)

rect(-0.7,-1.7,2.2,-1.2,border = "orange",lwd = 2)

clusplot(customer,fit$cluster,color = TRUE,xlim = c(-0.7,2.2),ylim =c(-1.7,-1.2))

原理

本节绘制了一个二元聚类图以展示数据聚类的过程,我们首先安装和导入cluster算法包,然后使用clusplot函数绘制customer数据集的二元聚类图,clusplot函数的shade和color参数值均被设置成TRUE,得到一个彩色且带边框的聚类。 在得到的结果图中,可以得知二元聚类使用了两个成分,x轴与y轴涵盖了85.01%的数据点,数据点根据成分1和成分2的取值散落在图中,同一簇内的数据点采用相同的颜色和形状绘制。

我们还使用了rect函数来增加一个矩形框对给定x轴和y轴内的簇进行特别标注,然后调用clusplot函数,设置好xlim与ylim参数的值,将被选中的簇放大到显示以便不好的观测簇内数据点的特征。

r语言修改横坐标斜体的方法是:

1、取FALSE时将不会画出标题(包括主、副标题及坐标轴标题)。

2、设置边框形式,默认值为"o",表示四面边框都画出。其余可选值包括"l"(左下)、7(上右)、c(上下左)、u(左下右)、"]"(上下右)和"n"(无,即不画边框)。

3、设置x轴和y轴的范围,默认值为r,表示坐标轴比给定作图范围,比参数xlim和ylim给出的范围大一些。赋值为i时表示坐标轴范围与给定作图范围完全相同。

4、取n时,坐标轴、刻度线以及刻度值将不会画出。

代码如下:

>plot(x$x1,x$x2,

+ main="relationship between x1 and x2",

+ xlab="x1",

+ ylab="x2",

+ xlim=c(0,100),

+ ylim=c(0,100),

+ col="red")

扩展资料

R语言强大的功能:

1、R的标记语言可以制作可重复生成的Word和Powerpoint文档

R语言中的rmarkdown包可以制作可重复生成的Word文档和Powerpoint幻灯片,而这只需要改变一行YAML的代码。

2、组建和运行一个可交互的网络应用只需要几行代码

几行R代码就可以生成一个可交互的网络应用。比方说如果使用R语言的flexdashboard包, 只需要36行代码,就可以生成一个可交互的动态报表,来探索BMI指数与全国健康营养检查样本结果的关联。