R语言中有哪些包可以处理批次效应

Python020

R语言中有哪些包可以处理批次效应,第1张

可以用sva包处理,R sva包去除批次效应(batch effect)标签:batch-effectr生物信息学前言:sva包可以去除高通量实验中的批次效应和其它一些无关变量带来的影响。分为两个步骤:1.鉴定和评估实验中潜在的影响变量;2.直接应用ComBat去除已知的批次效应;在sva包中,假定有两种变量需要考虑:1.兴趣变量(如癌症和正常对照)。2.调整变量(如:病人的性别、病人的年龄等)。另外有两种模型矩阵(model matrices):1. full model(全模型):包含以上的两种变量;2. null model:只包含调整变量。

1 读取,计算均值,箱图观察

2 查看数据分布

2.1 hist直方图

2.2 qqnorm散点图

3 Shapiro-Wilk正态性检验

4 方差齐性检验

意义:方差分析就是在大家误差水平差不多的条件下看控制和对照组是不是有显著差异。那方差其实就是误差水平了。当方差不一致的时候,这个方法就没法分辨出究竟是控制造成的差异还是,内在的波动造成的差异。

参考: https://www.zhihu.com/question/21195390

参考: https://blog.csdn.net/tiaaaaa/article/details/58130363

4.1 F检验

使用条件:数据正态分布,只可以检验两个样本

4.2 bartlett检验

使用条件:正态分布的数据,多个样本

4.3 levene检验

没有条件:数据可不具正态性,可以检验多个总体的方差齐性

SPSS的默认方差齐性检验方法

5 差异检验

5.1 参数检验:T检验

使用条件:两样本来自正太分布总体,方差齐

5.2 非参数检验:Wilcoxon秩和检验(两样本)

参数:

参考: https://www.jianshu.com/p/f30d1fe877ea

5.3 非参数检验:Kruskal-Wallis(KS)秩和检验(多样本)

5.4 Deseq两组reads count差异分析