核密度图能说明什么

Python015

核密度图能说明什么,第1张

密度图能说明数据出现的次数,是一组数据在坐标轴上“疏密程度”的可视化,密度图使用拟合后的(平滑)的曲线显示,“峰”越高表示此处数据越“密集”,“密度”越高。

核密度估计实际上是表现一组数据的分布情况,转录组中用来展示所有样本基因的表达量丰度分布,核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。

核密度估计是用于估计随机变量概率密度函数的一种非参数方法,是一种用来观察 连续型变量分布 的有效方法

density(x, bw = "nrd0", adjust = 1,kernel = c("gaussian", "epanechnikov", "rectangular", "triangular", "biweight", "cosine", "optcosine"),weights = NULL, window = kernel, width,give.Rkern = FALSE,n = 512, from, to, cut = 3, na.rm = FALSE, ...)

使用sm包中的sm.density.compare()函数可以想图形叠加两组或者更多的核密度图,使用格式为: sm.density.compare(x,factor) ,其中x为一个数值型变量,factor为一个分组变量

核密度图也是一种用来观察连续型变量分布的有效方法。

考虑mtcars数据集的mpg变量

>plot(density(mtcars$mpg))

从图中我们可以更详细地观察mpg变量的分布情况。

核密度图可用于比较组间的差异。如果想要比较cyl=4,6,8这三种不同组的汽车mpg变量分布的差异。可以使用sm包。

>library(sm)

>cyl.f <- factor(mtcars$cyl,levels=c(4,6,8),labels=c("4 cyl","6 cyl","8 cyl"))

>sm.density.compare(mtcars$mpg,mtcars$cyl)

>legend(locator(1),levels(cyl.f),fill=c(2,3,4))

从图中,可以明显看出,根据cyl数量分成的三组汽车的mpg变量分布差异。