R语言初步-数据转换-4.mutate()函数

Python07

R语言初步-数据转换-4.mutate()函数,第1张

mutate:变异 突变 改变 数据修改

紧接着创建新的列gain和speed

新创建的列同时也可以使用(但是保留的方法仍然是赋值给某个名称):

由于系统显示限制,最后一列没有展示出来,运行view()函数即可:

如果只想要保留新的变量,那就使用transmute()函数:

此时参与计算的arr_delay、dep_delay、air_time、hours都消失,只有新转换的gain、hours 、gain_per_hour三列。

mutare()函数可以和前面提到的几个函数结合起来使用。其中进行运算的时候,肯定会涉及到R语言的计算语言,以下列出几个常用的:

举例:

组内相关系数(intra-class correlation coefficient, ICC)的用途、类型以及计算。

ICC常用于衡量某个指标(比如,皮层厚度)在多次测量中的一致性/相似性(即信度)。在概念上,ICC等于真实的(被试间)变异除以观测的变异,观测的变异等于真实的变异加上噪声变异。比如,ICC=0.5表示真实变异和噪声变异相同。ICC越高,表明观测/测量越可靠。ICC的理论范围在0-1,一般地,ICC位于0-0.5之间表示信度差,0.5-0.75表示中等,0.75-0.9表示好,0.9-1表示极好(也存在其他分类标准)。

信度的现实意义在于,如果信度低,那么对于检测同样的效果量,需要更大的样本量

根据如何计算ICC,可以分为三个类型,即ICC(1,1), ICC(2,1)和ICC(3,1)。ICC(2,1)也表示为ICC(A,1),ICC(3,1)也表示为ICC(C,1)。在MRI脑成像中,ICC(2,1)似乎是最常用的。ICC(2,1)和ICC(3,1)的区别在于是否考虑多次测量之间的系统性噪声,直观来说,就是ICC(2,1)对变量的均值敏感,ICC(3,1)对变量的均值不敏感。作为对比,熟知的皮尔逊相关系数对于变量的均值和方差都不敏感,只对变量之间的协方差敏感。

在具体估计方法上,常见的有ANOVA和LME(linear mixed-effects)两种。LME的好处是不会出现ICC<0的情况,以及可以处理存在缺失值/协变量的情况。