1.单变量检测法
2.双变量检测法
3.多元模型检测法
离群值 (outliers)是指在一份数据中,与其他观察值具有明显不同特征的那些观察值。然而,并没有一个明确的准则来判断哪些观察值属于“离群值”。这主要取决于多种因素。
在使用boxplot描述数据时,离群值的存在会干扰boxplot可视化的结果。
在网上找到的解决方法为设置 geom_boxplot(outlier.shape = NA) ,并使用 coord_cartesian() 函数进行y轴的缩放。下面有一组随机数展示
这样的好处在于我们并没有舍去离群值,而是将离群值隐藏起来,并通过对y轴的缩放获得更好的可视化结果。例如,如果直接使用 ylim() 函数来调整y轴的范围则是直接移除离群值。
完。