统计学SNK是什么

Python016

统计学SNK是什么,第1张

SNK (Student-Newman-Keuls)q检验,用于多个样本均数的两两比较。在方差分析后,如果结果显著,需要进行事后检验,q法适用于两两检验

SNK为Student-Newman-Keuls三人姓氏的缩写,把要比较的各个平均数从大到小排列,并写上等级r,这是q法的亮点,计算公式:

其中 i 和j 代表两个水平的数据,

由于不同数据的df不同,对应的临界q值也不同,查表得出临界q值各组容量都为n,则

MseMSe代表均方误差,是对误差

的无偏估计。从总体中抽取大小为n的样本,样本平均数的标准误为

这是公式的原理。完全随机设计中若各组容量不同,则

MSe代表均方误差

SPSS

以单变量单因素方差分析为例,一列因变量,一列自变量(4个水平),在事后检验选取SNK检验,可以发现四个组被按照相似程度划分成了2个子集,表格内会显示组均值,最下面一排显示显著性。

扩展资料

原理

方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个:

(1) 实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和的总和表示,记作SSb,组间自由度dfb。

(2) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示, 记作SSw,组内自由度dfw。

总偏差平方和 SSt = SSb + SSw。

组内SSw、组间SSb除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MSw和MSb,一种情况是处理没有作用,即各组样本均来自同一总体,MSb/MSw≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MSb>>MSw(远远大于)。

MSb/MSw比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。

参考资料来源:百度百科-SNK q检验

参考资料来源:百度百科-方差分析

前面几篇通过参数检验和非参数检验对多组数据进行检验后,发现有差异,那么究竟是哪几个之间有差异,这就涉及到本篇所讲的事后检验或者事后两两检验。真如前面几篇中写的,事后检验和compare_means()和stat_compare_means()这两个函数默认的对两两之间进行差异比较是有区别的。

本篇就事后检验进行R语言的实践和操作。

还是把最开始的那幅图贴上,最后一部分就是事后检验的方法选择

从图中可以看出,参数检验和非参数检验在多组比较有差异后进行两两比较方法的选择。

数据依然使用 统计方法的选择(2)--参数检验 中三组小鼠的实验的数据,

结果如下

p值>0.05,符合正态分布和方差齐性

接下来进行方差分析

结果如下

经过ANOVA方差分析,发现p<0.05,说明全局角度有差异,那么接下来对两两进行比较。

每个分组的数目都是相等的,事后检验首选Tukey HSD法,并添加conf.level = 0.95置信区间。

这里的p值和之前直接比较得来的p值是有区别的,之前直接比较的结果如下

可以发现通过事后比较的方法得到的p值,显著差异的是明显小于直接比较的,这也就可以解释通过直接比较会增加犯Ⅰ类错误的概率。

还可以使用agricolae包中的LSD.test函数实现参数事后检验

依然是上面的数据,操作如下

console=T可以直接展示结果

最后的结果只是将各组分组,不同字母表示不同组别,具有差异性,结果可以看出3组和1组不具有差异性,和之前做的图也是符合的。

参数事后检验还有其他方法,比如SNK法(Student-Newman-Keuls)事后检验,Duncan事后检验,Scheffe事后比较,这几个方法的检验都在agricolae包中,展现形式不外乎以上两种方式。

非参数事后检验的数据还是使用 统计方法的选择(3)--非参数检验 中的数据。

先加载数据并查看数据

主要探索DEPDC1基因的表达情况

先进性正态性和方差齐性检验

结果如之前所写,正态性检验和方差齐性检验,p值都小于0.05,所以不符合正态性,方差不齐,采用非参数检验。对于多组非参数比较,采用用用kruskal.test()

结果如下

p值小于0.05,多组之间有差异,那么进行组间比较,先看看之前直接比较的结果

对于非参数检验事后比较,这里采用posthoc.kruskal.nemenyi.test方法,操作如下

结果如下

结果还是有点小复杂,好像没有之前直接比较或者与平均值比较更清晰,并且差异性把分组也加入了,这个还要继续再探索一下。