基本图形-核密度图

JavaScript016

基本图形-核密度图,第1张

核密度图也是一种用来观察连续型变量分布的有效方法。

考虑mtcars数据集的mpg变量

>plot(density(mtcars$mpg))

从图中我们可以更详细地观察mpg变量的分布情况。

核密度图可用于比较组间的差异。如果想要比较cyl=4,6,8这三种不同组的汽车mpg变量分布的差异。可以使用sm包。

>library(sm)

>cyl.f <- factor(mtcars$cyl,levels=c(4,6,8),labels=c("4 cyl","6 cyl","8 cyl"))

>sm.density.compare(mtcars$mpg,mtcars$cyl)

>legend(locator(1),levels(cyl.f),fill=c(2,3,4))

从图中,可以明显看出,根据cyl数量分成的三组汽车的mpg变量分布差异。

核密度图能说明数据出现的次数,是一组数据在坐标轴上“疏密程度”的可视化,密度图使用拟合后的(平滑)的曲线显示,“峰”越高表示此处数据越“密集”,“密度”越高。核密度估计实际上是表现一组数据的分布情况,转录组中用来展示所有样本基因的表达量丰度分布,核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。

核密度图的峰值大小计算方法如下,对于不同的要素,核密度的计算方式有所不同。主要有点要素法和面要素法,核密度图是一种非参数检验方法,其是对直方图的进一步抽象化,但其更加直观,其曲线下面积为1,通常用于连续数据的直观展示,比如年龄的分布情况,身高的分布情况等。