2.在使用的三种分类研究方法中,决策树模型的效果最优,因此可以使用该方法进行鸢尾花数据集的分类预测研究。
1.在对鸢尾花数据集进行聚类时,K-means、K-medoids两种聚类方法的正确率相同,可见在数据集离群点和噪音不大的情况下,二者聚类效果基本相同,但当出现离群点和噪音时,应该考虑K-medoids聚类方法;
2.鸢尾花数据集进行聚类分析时,划分聚类效果优于层次聚类;
3.对于量纲不一致的数据,应进行标准化,但对于量纲一致的数据,标准化之后结果并不一定优于未标准化的数据得到的结果。
那么圆形的树状图如何实现呢?我查找了一下相关资料。R语言包 dendextend 这个包可以实现,利用 help(package="dendextend") 查看帮助文档,能够看到其中的一个小例子
但是这个后期美化起来好像不太方便。
还找到了一个参考链接是
http://talgalili.github.io/dendextend/articles/dendextend.html
介绍的也是 dendextend 这个包的用法。
这个时候再运行上面提到的例子就可以直接得到结果
把树的形状改为圆形,添加样本的名称
鸢尾花数据集是150个样本,用圆形的图看下效果
最终的结果是
这里关于最外圈文本位置的调整,我还的再仔细看看,这里出图后位置不太合适,我是手动调整的!