R语言:有关差异分析的检验方法

Python045

R语言:有关差异分析的检验方法,第1张

1 读取,计算均值,箱图观察

2 查看数据分布

2.1 hist直方图

2.2 qqnorm散点图

3 Shapiro-Wilk正态性检验

4 方差齐性检验

意义:方差分析就是在大家误差水平差不多的条件下看控制和对照组是不是有显著差异。那方差其实就是误差水平了。当方差不一致的时候,这个方法就没法分辨出究竟是控制造成的差异还是,内在的波动造成的差异。

参考: https://www.zhihu.com/question/21195390

参考: https://blog.csdn.net/tiaaaaa/article/details/58130363

4.1 F检验

使用条件:数据正态分布,只可以检验两个样本

4.2 bartlett检验

使用条件:正态分布的数据,多个样本

4.3 levene检验

没有条件:数据可不具正态性,可以检验多个总体的方差齐性

SPSS的默认方差齐性检验方法

5 差异检验

5.1 参数检验:T检验

使用条件:两样本来自正太分布总体,方差齐

5.2 非参数检验:Wilcoxon秩和检验(两样本)

参数:

参考: https://www.jianshu.com/p/f30d1fe877ea

5.3 非参数检验:Kruskal-Wallis(KS)秩和检验(多样本)

5.4 Deseq两组reads count差异分析

r实验指的是科学研究的基本方法之一。根据科学研究的目的,尽可能地排除外界的影响,突出主要因素并利用一些专门的仪器设备,而人为地变革、控制或模拟研究对象,使某一些事物(或过程)发生或再现,从而去认识自然现象、自然性质、自然规律。

科学实验,是指根据一定目的,运用一定的仪器、设备等物质手段,在人工控制的条件下,观察、研究自然现象及其规律性的社会实践形式。是获取经验事实和检验科学假说、理论真理性的重要途径。它不仅包括仪器、设备、实验的物质对象,还包括背景知识、理论假设、数据分析、科学解释,以及实验者之间的协商、交流和资金的获取等相关社会因素。其性质不只是物质性的,还是文化性的和社会性的。

通常把对物理特性的检验称为物理检验对化学性质或组成的检验称为化学检验或简称化验。检验一般有破坏性检验和非破坏性检验,前者只能从整体中取样进行抽查,然后用数理统计方法推定整体的情况后者可对整体进行逐个检查。从被检对象的类别考虑,人们又常将它分为半成品检验、成品检验或商品检验等。

也指用工具、仪器或其它分析方法检查各种原材料、半成品、成品是否符合特定的技术标准、规格的工作过程。

对产品或工序过程中的实体,进行度量,测量,检查,和实验分析,并将结果与规定值进行比较和确定是否合格所进行的活动。

一般根据数据是否符合正态分布,选择合适的统计方法:

T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。t检验是用t分布理论来推论差异发生的概率, 从而比较两个平均数的差异是否显著。 它与 Z检验 、 卡方检验 并列。

其他进行正态性检验的函数 (如下函数都属于nortest包)

Lillie.test()

ad.test()

cvm.test()

pearson.test()

sf.test()

不同的函数可能会得到不同的结果。

对于不服从正态分布的数据,可以采用一些方法使它服从正态分布。

var.test只能用于两样本方差齐性检验

当数据不满足正态分布的时候,要进行t检验必须进行原始数据的变换。如取log,平方根,倒数, boxCox转换 等。

Wilcox秩和检验(又称Mann-Whitney U检验)是对原假设的非参数检验,在不需要假设两组样本数据为正态分布的情况下,测试二者数据分布是否存在显著差异,此检验适用于数据分布属于非正态性的分析对象,其适用范围相较于t检验广泛。

执行wilcoxon秩和检验(也称Mann-Whitney U检验)这样一种非参数检验 。t检验假设两个样本的数据集之间的差别符合正态分布(当两个样本集都符合正态分布时,t检验效果最佳),但当服从正态分布的假设并不确定时,我们执行wilcoxon秩和检验来验证数据集中mtcars中自动档与手动档汽车的mpg值的分布是否一致,p值<0.05,原假设不成立。意味两者分布不同。警告“无法精确计算带连结的p值“这是因为数据中存在重复的值,一旦去掉重复值,警告就不会出现。