R语言高级方法进行缺失数据多重插补案例演示

Python018

R语言高级方法进行缺失数据多重插补案例演示,第1张

当我们在数据集中缺少值时,重要的是考虑为什么它们会丢失以及它们对分析的影响。有时忽略丢失的数据会降低功耗,但更重要的是,有时它会使答案有偏差,并有可能误导错误的结论。因此,重要的是要考虑丢失的数据机制是什么,以便对其进行处理。 Rubin(1976)区分了三种类型的误报机制:

就是你之前一个无限制模型(Unrestricted Model)的那个对象(object),比如题主这里举例说可以是: lm.test<-lm(y~X1+X2+X3,data=D).这个model就是lm.test这个线性回归对象。

与T检验相似,ANOVA同样要求数据服从正态分布;此外,ANOVA还建立在各组方差相等的基础上。因此,在执行单因素ANOVA之前,我们首先应当对数据进行正态性分布验证,以及方差齐性检验。