R语言中的一致性检验丨数析学院

Python012

R语言中的一致性检验丨数析学院,第1张

在诊断试验中,研究者希望考察不同诊断方法在诊断结果上是否具有一致性,比如:不同医务工作者对同一组病人的诊断结果是否一致、不同的诊断方法对同一个样本或研究对象的化验结果是否一致等。Cohen 等提出用 Kappa 值作为评价一致性的指标,并得到了广泛的应用,本节将向大家介绍不同条件下的一致性检验。

用于一致性检验的方法取决于数据类型(属性数据,顺序数据,连续数据)以及需要检验的结果组数。

以下是 irr 包中的diagnoses 数据集的一部分,包括三个医生对 30 位病人的诊断结果。

两组结果一致性检验: Cohen’s Kappa

多组结果一致性检验: Fleiss’s Kappa, Conger’s Kappa

如果出现多个评分者,将使用Fleiss’s Kappa。

当然也可以使用Conger’s (1980) 的方法计算精确的Kappa。(注意:目前不知道这个方法效果相对于普通的是好是坏。)

今天我们将通过一个例子来说明如何分析两个定类变量。

文章背景:我们想研究CFPS2010和CFPS2012青少年对自身的职业期望。

如表1,我们将原始的职业期望编码整合成9类(职业编码的大类)和其他。由于我们想分析同一个人在跨轮次调查中职业期望的稳定性情况,故将分析对象定义为在CFPS2010和CFPS2012中都回答了自己对自己职业期望的受访者。如表2所示,进行重编码后的数据是宽数据,样本量是1920,数据集名字为expect。我们在进行后续分析时,要将其转换为绘图所需的其他形式。

⭐分析方式1——列联表、频数与频率

在表3中,我们展示了2010与2012年青少年职业期望的交叉统计情况。同时该表内,也附上了频数(落在各类别中的数据个数)、⽐例(某⼀类别数据占全部数据的⽐值)、百分⽐(将对⽐的基数作为100⽽计算的⽐值,包括百分比、行百分比和列百分比)。

⭐分析方式2——统计图表

分析前色彩讲解:预设渐变色,我们这里介绍2个色彩包。

1)专门生产系列颜色的RColorBrewer包,详见图1中的系列颜色。

library(RColorBrewer)

display.brewer.all()

2)色盲友好的配色方案viridis包,详见图2中的系列颜色。

library(viridis)

?viridis()#可以看到更多对这组包色彩的说明

接下来我们来画图吧~【注:图3-图6中的类目数字的含义:1)国家机关、党群组织、企业、事业单位负责人;2)医生;3)教师;4)专业技术人员(刨除教师和医生);5)办事人员和有关人员;6)商业、服务业人员;7)农、林、牧、渔、水利业生产人员;8)生产、运输设备操作人员及有关人员;9)军人;10)其他。】