R 语言
R 的源代码可自由下载使用,亦有已编译的可执行文件版本可以下载,可在多种平台下运行,包括 UNIX(也包括 FreeBSD 和 Linux)、Windows 和 MacOS。R 主要是以命令行操作,同时有人开发了几种图形用户界面,其中 RStudio 是最为广泛使用的集成开发环境。
R 内置多种统计学及数字分析功能。R 的功能也可以透过安装包(Packages,用户撰写的功能)增强。因为 S 的血缘,R 比其他统计学或数学专用的编程语言有更强的面向对象(面向对象程序设计, S3, S4 等)功能。
R 的另一强项是绘图功能,制图具有印刷的素质,也可加入数学符号。
虽然 R 主要用于统计分析或者开发统计相关的软件,但也有人用作矩阵计算。其分析速度可媲美专用于矩阵计算的自由软件 GNU Octave 和商业软件 MATLAB。
1 读取,计算均值,箱图观察
2 查看数据分布
2.1 hist直方图
2.2 qqnorm散点图
3 Shapiro-Wilk正态性检验
4 方差齐性检验
意义:方差分析就是在大家误差水平差不多的条件下看控制和对照组是不是有显著差异。那方差其实就是误差水平了。当方差不一致的时候,这个方法就没法分辨出究竟是控制造成的差异还是,内在的波动造成的差异。
参考: https://www.zhihu.com/question/21195390
参考: https://blog.csdn.net/tiaaaaa/article/details/58130363
4.1 F检验
使用条件:数据正态分布,只可以检验两个样本
4.2 bartlett检验
使用条件:正态分布的数据,多个样本
4.3 levene检验
没有条件:数据可不具正态性,可以检验多个总体的方差齐性
SPSS的默认方差齐性检验方法
5 差异检验
5.1 参数检验:T检验
使用条件:两样本来自正太分布总体,方差齐
5.2 非参数检验:Wilcoxon秩和检验(两样本)
参数:
参考: https://www.jianshu.com/p/f30d1fe877ea
5.3 非参数检验:Kruskal-Wallis(KS)秩和检验(多样本)
5.4 Deseq两组reads count差异分析