revman就是r语言吗

Python011

revman就是r语言吗,第1张

revman不是r语言。在元分析中用得较多的为CMA和Revman,在潜分类潜剖面分析中用的较多的为LatentGold和R语言,而像N2Mplus等,都是功能较为单一的辅助性统计软件,在多水平模型中用的较多的为HLM和MPLUS和R语言。

r语言的作用

R的标记语言可以制作可重复生成的Word和Powerpoint文档。R语言中的rmarkdown包可以制作可重复生成的Word文档和Powerpoint幻灯片,而这只需要改变一行YAML的代码,组建和运行一个可交互的网络应用只需要几行代码。

几行甚至一行R代码就可以支持网络应用的运行,R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支,可以认为R是S语言的一种实现,R是一套完整的数据处理和计算和制图软件系统。

HLM模型(hierarchical linear model,分层线性模型)有着多种稀少,可称作多水平模型,层次线性模型,或者混合效应模型,随机效应模型等。普通的线性回归模型研究X对于Y的影响,而HLM模型也研究X对于Y的影响,但是其考虑了group的聚集性因素(即考虑组内相关不独立问题)。

比如研究‘入学成绩X’对于‘中考成绩Y’的影响,个体是学生,学生隶属于学校group,并且样本数据来源于几个学校。那么不同学校(即group层面)之间的情况时‘入学成绩X’对于‘中考成绩Y’的影响时很可能不一样(比如好学校时可能影响幅度更高),如果希望将学校因素考虑进入,此时学校就是一个聚集性因素group,诸如此类研究时即可使用HLM模型。

HLM模型时涉及到两个重要的专业术语,分别是‘固定效应’和‘随机效应’,其说明如下表:

固定效应是指做HLM模型时,不涉及group干扰时的影响关系研究;随机效应可指在group层面时的影响关系情况,更进一步说明例子如下表:

如果完全不考虑group,即不考虑‘聚集性’问题,那么直接使用线性回归即可,并不需要使用HLM模型,HLM模型就是处理‘聚集性’问题的一种进阶方法;如果说使用HLM模型,并且在分析时只考虑个体效应不需要考虑group层面的效应,即只有固定效应项并无随机效应项;如果说使用HLM模型,并且在分析时考虑个体效应的同时还考虑group层面的效应,即包括固定效应项和随机效应项。

案例:

1, 背景

当前有一项研究,研究样本为65所学校共计4059名学生,研究内容为学生入学成绩对于最终成绩的影响情况,由于学生样本来源于65所不同的学校,而且不同学校层次有着较大区别,因此需要将学校(即group项)的聚集性纳入考虑范畴中。研究数据中涉及的字段如下说明:

2,理论

HLM模型研究是对传统回归模型的进一步精细分析,研究者可深入探讨数据的变异是否在高层次(group)中存在着聚集性。一般分析时分为两个步骤如下说明:

第一步: 首先只考虑固定效应,即不纳入随机效应;然后通过结果中的ICC值判断【group层面】因变量的变异幅度(ICC值越大意味着【group层面】因变量的变异幅度越大,一般ICC值较小比如小于0.1时,意味着【group层面】因变量的变异力度较低,意味着聚集性较弱,此时可考虑直接放弃HLM模型改用常见的回归模型即可);

第二步: 如果说ICC值较大(比如大于0.1时),此时可进一步探究‘随机效应’对【group层面】带来的变异情况,加入group层次水平的研究项,深入探究它们对于【group层面】变异的解释情况。比如第一步中得到的ICC值为0.2,第二步之后 得到的ICC值为0.1,减少为0.2-0.1=0.1,也即说明新加入‘随机效应’项会对【group层面】产生0.1(10%)的变异解释力度。

特别提示:

3, 操作

本例子中操作上第一步先不放入‘随机效应’项,即只放入如下图所示:

在第一次分析之后,发现ICC值为0.144较大,即意味着【group层面】即学校中考成绩的变异为14.4%。因此考虑纳入‘随机效应’项,将‘入学成绩’项纳入模型中,以深入探究‘入学成绩’对于【group层面】‘中考成绩’的解释力度(即入学成绩会对中考成绩有影响,但是在不同学校group间是否有差异性)。

4, SPSSAU输出结果

SPSSAU共输出4个表格,分别‘模型基本情况’,‘固定效应参数估计’,‘随机效应协方差估计结果’,‘随机效应参数估计的相关矩阵’,分别说明如下:

5,文字分析

本案例共进行了两次。第一次时不纳入‘随机效应’项,得到结果分别如下:

上表格展示出本次研究的总样本数量是4059个,而且有65组,即group项有65个不同的数字(即65所学校),其中某学校最少只有2个学生个体样本,某学校最多有198个学生个体样本,平均来看每所学校为62.4个学生个体样本。以及HLM模型使用REML似然法估计,log似然值为-4681.13。

‘固定效应参数估计’表格展示固定效应情况,即‘入学成绩’对于‘中考成绩’的影响,上表可知:回归系数值为0.563>0,并且此路径呈现出0.01水平的显著性(z=45.106,p=0.000<0.01),因而说明入学成绩会对中考成绩产生显著的正向影响关系,即学生入学成绩越高,那么学生中考成绩也会越高。

由于第一次分析结果中并没有纳入‘随机效应’分析项,因此‘随机效应协方差估计结果’只会有截距和残差这两项,通过此两项可计算得到ICC值,计算公式为:组内相关系数ICC=截距项方差 / (截距项方差+残差项方差),即组间方差 /(组间方差 + 组内方差)。上表格显示ICC为0.144(此值相对较大),意味着【group层面】中考成绩的变异为14.40%。

与此同时,截距的回归系数值(variance或sd值均可称回归系数值)为0.094且呈现出显著性,意味着【group层面】之间的中考成绩有着明显的差异性。由于ICC值较大和【group层面】之间有着差异性,因此接下来再进一步纳入‘随机效应项’进行深入考虑,考虑‘随机效应项’对于【group层面】上的中考成绩变异的解释情况。

接着将‘入学成绩’这个学校水平上的数据作为‘随机效应项’纳入模型中,因而第2次分析的操作如下图:

第2次分析的结果分别如下面4个表格所示:

此表格信息并没有变化,不再赘述。

‘固定效应参数估计’表格展示固定效应情况,即‘入学成绩’对于‘中考成绩’的影响,上表可知:回归系数值为0.557>0,并且此路径呈现出0.01水平的显著性(z=27.588,p=0.000<0.01),因而说明入学成绩会对中考成绩产生显著的正向影响关系,即学生入学成绩越高,那么学生中考成绩也会越高。

特别提示:

在纳入‘入学成绩’这一‘随机效应’项之后,从上表可以看出:ICC值由第1次分析时的0.144上升到0.145,即增加幅度为0.001,也即说明‘入学成绩’可以提高【group层面】即学校层面‘中考成绩’的变异幅度为0.1%,此比例相对非常低可以基本可以忽略。

截距项呈现出0.01水平的显著性(z=3.625,p=0.000<0.01),即意味着不同【group层面】即学校层面之间的中考成绩有着差异性。与此同时从上表格看到:‘入学成绩’这一‘随机效应’项呈现出显著性(z=2.356,p=0.018<0.05),即意味着‘入学成绩’对于中考成绩的影响时,不同【group层面】即学校层面时有着差异性。

即最终得到结论:【group层面】即学校层面之间的中考成绩确实有着差异性(z=2.356,p=0.018<0.05),而且‘入学成绩’对于‘中考成绩’的影响时(z=2.356,p=0.018<0.05),会有着【group层面】即学校之间的差异性。

特别提示:

如果希望研究某随机效应项的加入,带来【group层面】(本案例为学校)中考成绩的解释力度变化,那么可使用计算公式为:

(Coef_intercept1 – Coef_intercept2)/ Coef_intercept1

【Coef_intercept表示第n次‘随机效应协方差估计结果’表格中‘截距’项的回归系数】,本案例中第1次分析得到的值为0.094,第2次为0.092,即为(0.094-0.092)/0.094=2.12%,即‘入学成绩’可以解释【group层面】即学校层级的平均成绩差异2.12%的原因。

‘随机效应参数估计的相关矩阵’表格展示随机效应项间的相关关系情况,比如上表格中0.425指随机效应截距项与‘入学成绩’间的相关情况,可理解为【group层面】学校间成绩差异与‘入学成绩’间的相关关系情况。该值较大,因此并不需要设置‘随机效应协方差为0’,如果该值较小比如小于0.2,可考虑设置模型中‘随机效应协方差为0’打勾即假定没有协方差关系。

6,剖析

涉及以下几个关键点,分别如下:

HLM分析思路上并没有固定标准,通常是第1步不纳入‘随机效应项’,结合ICC值和随机效应表格中的截距项显著性,判断【group层面】的变异是否存在,如果存在则纳入‘随机效应项’后深入挖掘‘随机效应项’带来【group层面】的变异情况等;

7,疑难解惑

① HLM模型的数据格式是什么样的?

HLM模型的数据格式可 点击查看

② HLM模型中ICC值的意义是?

HLM模型时,ICC的计算公式为:组内相关系数ICC=截距项方差 / (截距项方差+残差项方差),即组间方差 /(组间方差 + 组内方差),该指标值代表着【group层面】差异幅度。

③ 涉及几个名词的意义说明?

在HLM效应分析时,涉及到专业名词包括固定效应,随机效应等,说明如下表格:

④ 标准误计算说明:z或t检验?

HLM模型时标准误的计算时,不同软件的计算方式并不同,并且可能使用t检验或者z检验,SPSSAU当前使用z检验。