组内相关系数的意义及R语言实现

Python021

组内相关系数的意义及R语言实现,第1张

组内相关系数(intra-class correlation coefficient, ICC)的用途、类型以及计算。

ICC常用于衡量某个指标(比如,皮层厚度)在多次测量中的一致性/相似性(即信度)。在概念上,ICC等于真实的(被试间)变异除以观测的变异,观测的变异等于真实的变异加上噪声变异。比如,ICC=0.5表示真实变异和噪声变异相同。ICC越高,表明观测/测量越可靠。ICC的理论范围在0-1,一般地,ICC位于0-0.5之间表示信度差,0.5-0.75表示中等,0.75-0.9表示好,0.9-1表示极好(也存在其他分类标准)。

信度的现实意义在于,如果信度低,那么对于检测同样的效果量,需要更大的样本量

根据如何计算ICC,可以分为三个类型,即ICC(1,1), ICC(2,1)和ICC(3,1)。ICC(2,1)也表示为ICC(A,1),ICC(3,1)也表示为ICC(C,1)。在MRI脑成像中,ICC(2,1)似乎是最常用的。ICC(2,1)和ICC(3,1)的区别在于是否考虑多次测量之间的系统性噪声,直观来说,就是ICC(2,1)对变量的均值敏感,ICC(3,1)对变量的均值不敏感。作为对比,熟知的皮尔逊相关系数对于变量的均值和方差都不敏感,只对变量之间的协方差敏感。

在具体估计方法上,常见的有ANOVA和LME(linear mixed-effects)两种。LME的好处是不会出现ICC<0的情况,以及可以处理存在缺失值/协变量的情况。

用stata的话,假设y是二元因变量,g是分组变量

那么ICC可以用以下命令得出:

melogit y

melogit y || g :

estat icc