revman就是r语言吗

2023-02-21 22:48:02Python011

revman就是r语言吗,第1张

revman不是r语言。在元分析中用得较多的为CMA和Revman，在潜分类潜剖面分析中用的较多的为LatentGold和R语言，而像N2Mplus等，都是功能较为单一的辅助性统计软件，在多水平模型中用的较多的为HLM和MPLUS和R语言。

r语言的作用

R的标记语言可以制作可重复生成的Word和Powerpoint文档。R语言中的rmarkdown包可以制作可重复生成的Word文档和Powerpoint幻灯片，而这只需要改变一行YAML的代码，组建和运行一个可交互的网络应用只需要几行代码。

几行甚至一行R代码就可以支持网络应用的运行，R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支，可以认为R是S语言的一种实现，R是一套完整的数据处理和计算和制图软件系统。

HLM模型(hierarchical linear model，分层线性模型)有着多种稀少，可称作多水平模型，层次线性模型，或者混合效应模型，随机效应模型等。普通的线性回归模型研究X对于Y的影响，而HLM模型也研究X对于Y的影响，但是其考虑了group的聚集性因素（即考虑组内相关不独立问题）。

比如研究‘入学成绩X’对于‘中考成绩Y’的影响，个体是学生，学生隶属于学校group，并且样本数据来源于几个学校。那么不同学校(即group层面)之间的情况时‘入学成绩X’对于‘中考成绩Y’的影响时很可能不一样（比如好学校时可能影响幅度更高），如果希望将学校因素考虑进入，此时学校就是一个聚集性因素group，诸如此类研究时即可使用HLM模型。

HLM模型时涉及到两个重要的专业术语，分别是‘固定效应’和‘随机效应’，其说明如下表：

固定效应是指做HLM模型时，不涉及group干扰时的影响关系研究；随机效应可指在group层面时的影响关系情况，更进一步说明例子如下表：

如果完全不考虑group，即不考虑‘聚集性’问题，那么直接使用线性回归即可，并不需要使用HLM模型，HLM模型就是处理‘聚集性’问题的一种进阶方法；如果说使用HLM模型，并且在分析时只考虑个体效应不需要考虑group层面的效应，即只有固定效应项并无随机效应项；如果说使用HLM模型，并且在分析时考虑个体效应的同时还考虑group层面的效应，即包括固定效应项和随机效应项。

案例：

1，背景

当前有一项研究，研究样本为65所学校共计4059名学生，研究内容为学生入学成绩对于最终成绩的影响情况，由于学生样本来源于65所不同的学校，而且不同学校层次有着较大区别，因此需要将学校（即group项）的聚集性纳入考虑范畴中。研究数据中涉及的字段如下说明：

2，理论

HLM模型研究是对传统回归模型的进一步精细分析，研究者可深入探讨数据的变异是否在高层次（group）中存在着聚集性。一般分析时分为两个步骤如下说明：

第一步： 首先只考虑固定效应，即不纳入随机效应；然后通过结果中的ICC值判断【group层面】因变量的变异幅度（ICC值越大意味着【group层面】因变量的变异幅度越大，一般ICC值较小比如小于0.1时，意味着【group层面】因变量的变异力度较低，意味着聚集性较弱，此时可考虑直接放弃HLM模型改用常见的回归模型即可）；

第二步： 如果说ICC值较大(比如大于0.1时)，此时可进一步探究‘随机效应’对【group层面】带来的变异情况，加入group层次水平的研究项，深入探究它们对于【group层面】变异的解释情况。比如第一步中得到的ICC值为0.2，第二步之后得到的ICC值为0.1，减少为0.2-0.1=0.1，也即说明新加入‘随机效应’项会对【group层面】产生0.1(10%)的变异解释力度。

特别提示：

3，操作

本例子中操作上第一步先不放入‘随机效应’项，即只放入如下图所示：

在第一次分析之后，发现ICC值为0.144较大，即意味着【group层面】即学校中考成绩的变异为14.4%。因此考虑纳入‘随机效应’项，将‘入学成绩’项纳入模型中，以深入探究‘入学成绩’对于【group层面】‘中考成绩’的解释力度（即入学成绩会对中考成绩有影响，但是在不同学校group间是否有差异性）。

4， SPSSAU输出结果

SPSSAU共输出4个表格，分别‘模型基本情况’，‘固定效应参数估计’，‘随机效应协方差估计结果’，‘随机效应参数估计的相关矩阵’，分别说明如下：

5，文字分析

本案例共进行了两次。第一次时不纳入‘随机效应’项，得到结果分别如下：

上表格展示出本次研究的总样本数量是4059个，而且有65组，即group项有65个不同的数字（即65所学校），其中某学校最少只有2个学生个体样本，某学校最多有198个学生个体样本，平均来看每所学校为62.4个学生个体样本。以及HLM模型使用REML似然法估计，log似然值为-4681.13。

‘固定效应参数估计’表格展示固定效应情况，即‘入学成绩’对于‘中考成绩’的影响，上表可知：回归系数值为0.563>0，并且此路径呈现出0.01水平的显著性（z=45.106，p=0.000<0.01），因而说明入学成绩会对中考成绩产生显著的正向影响关系,即学生入学成绩越高，那么学生中考成绩也会越高。

由于第一次分析结果中并没有纳入‘随机效应’分析项，因此‘随机效应协方差估计结果’只会有截距和残差这两项，通过此两项可计算得到ICC值，计算公式为：组内相关系数ICC=截距项方差 / (截距项方差+残差项方差），即组间方差 /（组间方差 + 组内方差)。上表格显示ICC为0.144（此值相对较大），意味着【group层面】中考成绩的变异为14.40%。

与此同时，截距的回归系数值（variance或sd值均可称回归系数值）为0.094且呈现出显著性，意味着【group层面】之间的中考成绩有着明显的差异性。由于ICC值较大和【group层面】之间有着差异性，因此接下来再进一步纳入‘随机效应项’进行深入考虑，考虑‘随机效应项’对于【group层面】上的中考成绩变异的解释情况。

接着将‘入学成绩’这个学校水平上的数据作为‘随机效应项’纳入模型中，因而第2次分析的操作如下图：

第2次分析的结果分别如下面4个表格所示：

此表格信息并没有变化，不再赘述。

‘固定效应参数估计’表格展示固定效应情况，即‘入学成绩’对于‘中考成绩’的影响，上表可知：回归系数值为0.557>0，并且此路径呈现出0.01水平的显著性（z=27.588，p=0.000<0.01），因而说明入学成绩会对中考成绩产生显著的正向影响关系,即学生入学成绩越高，那么学生中考成绩也会越高。

特别提示：

在纳入‘入学成绩’这一‘随机效应’项之后，从上表可以看出：ICC值由第1次分析时的0.144上升到0.145，即增加幅度为0.001，也即说明‘入学成绩’可以提高【group层面】即学校层面‘中考成绩’的变异幅度为0.1%，此比例相对非常低可以基本可以忽略。

截距项呈现出0.01水平的显著性（z=3.625，p=0.000<0.01），即意味着不同【group层面】即学校层面之间的中考成绩有着差异性。与此同时从上表格看到：‘入学成绩’这一‘随机效应’项呈现出显著性（z=2.356，p=0.018<0.05），即意味着‘入学成绩’对于中考成绩的影响时，不同【group层面】即学校层面时有着差异性。

即最终得到结论：【group层面】即学校层面之间的中考成绩确实有着差异性（z=2.356，p=0.018<0.05），而且‘入学成绩’对于‘中考成绩’的影响时（z=2.356，p=0.018<0.05），会有着【group层面】即学校之间的差异性。

特别提示：

如果希望研究某随机效应项的加入，带来【group层面】（本案例为学校）中考成绩的解释力度变化，那么可使用计算公式为：

（Coef_intercept1 – Coef_intercept2）/ Coef_intercept1

【Coef_intercept表示第n次‘随机效应协方差估计结果’表格中‘截距’项的回归系数】，本案例中第1次分析得到的值为0.094，第2次为0.092，即为（0.094-0.092）/0.094=2.12%，即‘入学成绩’可以解释【group层面】即学校层级的平均成绩差异2.12%的原因。

‘随机效应参数估计的相关矩阵’表格展示随机效应项间的相关关系情况，比如上表格中0.425指随机效应截距项与‘入学成绩’间的相关情况，可理解为【group层面】学校间成绩差异与‘入学成绩’间的相关关系情况。该值较大，因此并不需要设置‘随机效应协方差为0’，如果该值较小比如小于0.2，可考虑设置模型中‘随机效应协方差为0’打勾即假定没有协方差关系。

6，剖析

涉及以下几个关键点，分别如下：

HLM分析思路上并没有固定标准，通常是第1步不纳入‘随机效应项’，结合ICC值和随机效应表格中的截距项显著性，判断【group层面】的变异是否存在，如果存在则纳入‘随机效应项’后深入挖掘‘随机效应项’带来【group层面】的变异情况等；

7，疑难解惑

① HLM模型的数据格式是什么样的？

HLM模型的数据格式可点击查看

② HLM模型中ICC值的意义是？

HLM模型时，ICC的计算公式为：组内相关系数ICC=截距项方差 / (截距项方差+残差项方差），即组间方差 /（组间方差 + 组内方差)，该指标值代表着【group层面】差异幅度。

③ 涉及几个名词的意义说明？

在HLM效应分析时，涉及到专业名词包括固定效应，随机效应等，说明如下表格：

④ 标准误计算说明：z或t检验？

HLM模型时标准误的计算时，不同软件的计算方式并不同，并且可能使用t检验或者z检验，SPSSAU当前使用z检验。