秩和检验:不满足正态分布的数据用秩和检验
正态分布的检验
非正态分布
非正态分布中值比均值有意义
如果点在直线两侧则为正态分布。图示为非正态分布
wilcox.test(变量1,变量2)
prop.test(抽样阳性, 抽样总数, p=已知百分比, alternative = "greater")
alternative 参数,假设方向用greater或less,默认双侧检验。
用于检验实际观测值与理论推断值之间的偏离程度。卡方值越大说明偏离越大,卡方值越小,说明偏离程度低。卡方值为0说明完全符合。
1 读取,计算均值,箱图观察
2 查看数据分布
2.1 hist直方图
2.2 qqnorm散点图
3 Shapiro-Wilk正态性检验
4 方差齐性检验
意义:方差分析就是在大家误差水平差不多的条件下看控制和对照组是不是有显著差异。那方差其实就是误差水平了。当方差不一致的时候,这个方法就没法分辨出究竟是控制造成的差异还是,内在的波动造成的差异。
参考: https://www.zhihu.com/question/21195390
参考: https://blog.csdn.net/tiaaaaa/article/details/58130363
4.1 F检验
使用条件:数据正态分布,只可以检验两个样本
4.2 bartlett检验
使用条件:正态分布的数据,多个样本
4.3 levene检验
没有条件:数据可不具正态性,可以检验多个总体的方差齐性
SPSS的默认方差齐性检验方法
5 差异检验
5.1 参数检验:T检验
使用条件:两样本来自正太分布总体,方差齐
5.2 非参数检验:Wilcoxon秩和检验(两样本)
参数:
参考: https://www.jianshu.com/p/f30d1fe877ea
5.3 非参数检验:Kruskal-Wallis(KS)秩和检验(多样本)
5.4 Deseq两组reads count差异分析
R语言做单位根检验的两个方法:
1、用fUnitRoots包中的UnitrootTests()和adfTest()。
2、用tseries包中的adf.test()和pp.test()。
用法都基本类似,可以看一下help的example。
R语言
R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。
R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。
R语言的功能
R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统数组运算工具(其向量、矩阵运算方面功能尤其强大)完整连贯的统计分析工具优秀的统计制图功能简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。
单位根检验
单位根检验是指检验序列中是否存在单位根,因为存在单位根就是非平稳时间序列了。单位根就是指单位根过程,可以证明,序列中存在单位根过程就不平稳,会使回归分析中存在伪回归。
单位根检验是随机过程的问题。定义随机序列{x_t},t=1,2,…是一单位根过程,若x_t=ρx_t-1+ε,t=1,2…其中ρ=1,{ε}为一平稳序列(白噪声),且E[ε]=0,V(ε)=σ<∞,Cov(ε,ε)=μ<∞这里τ=1,2…。特别地,若{ε}是独立同分布的,且E[ε]=0,V(ε)=σ<∞,则上式就变成一个随机游走序列,因此随机游走序列是一种最简单的单位根过程。