核密度估计实际上是表现一组数据的分布情况,转录组中用来展示所有样本基因的表达量丰度分布,核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。
核密度估计是用于估计随机变量概率密度函数的一种非参数方法,是一种用来观察 连续型变量分布 的有效方法
density(x, bw = "nrd0", adjust = 1,kernel = c("gaussian", "epanechnikov", "rectangular", "triangular", "biweight", "cosine", "optcosine"),weights = NULL, window = kernel, width,give.Rkern = FALSE,n = 512, from, to, cut = 3, na.rm = FALSE, ...)
使用sm包中的sm.density.compare()函数可以想图形叠加两组或者更多的核密度图,使用格式为: sm.density.compare(x,factor) ,其中x为一个数值型变量,factor为一个分组变量
核密度图也是一种用来观察连续型变量分布的有效方法。
考虑mtcars数据集的mpg变量
>plot(density(mtcars$mpg))
从图中我们可以更详细地观察mpg变量的分布情况。
核密度图可用于比较组间的差异。如果想要比较cyl=4,6,8这三种不同组的汽车mpg变量分布的差异。可以使用sm包。
>library(sm)
>cyl.f <- factor(mtcars$cyl,levels=c(4,6,8),labels=c("4 cyl","6 cyl","8 cyl"))
>sm.density.compare(mtcars$mpg,mtcars$cyl)
>legend(locator(1),levels(cyl.f),fill=c(2,3,4))
从图中,可以明显看出,根据cyl数量分成的三组汽车的mpg变量分布差异。