R语言绘制配对样品箱线图

Python012

R语言绘制配对样品箱线图,第1张

配对箱线图,常见于配对样本的数据分析中。

例如下图示例,为了研究某些基因在肿瘤组织和正常组织中是否具有表达量的显著不同,在取样时,往往会在同一患者个体中同时获取肿瘤和临近正常组织,两个组织样本就是配对关系。当然在这类研究中,往往需要调查很多的患者,因此会获得大量的配对样本。随后,通过qPCR或RNA-seq等方法定量基因表达后,以箱线图呈现特定基因在肿瘤组织和正常组织中的整体表达水平,并在箱线图中以散点表示具体的样本,此时对于具有配对关系的肿瘤组织和正常组织样本,就可以通过连线连接起来。

这种配对箱线图的好处是,除了能够表现两组的整体差异,还能够清晰地呈现单个样本的前后改变。

本篇教程,就让我们带大家学习如何使用R语言绘制这种配对箱线图。

类似地,假设我们也期望查看某基因(例如MAP2)在肿瘤组织和正常组织中的表达改变情况,在收集了配对样本并检测了这些样本中基因表达水平后,配置这样一张表。

samples是样本名称;MAP2是基因MAP2在各样本中的表达值;group1是样本分组,告知它们来源于肿瘤组织还是正常组织;group2是配对样本信息,配对的两样本设置为同一亚组。

备注: 该示例数据集可点击这里获取。

随后,将上述示例数据导入R中。

绘制箱线图表示两组基因的整体表达水平,并以散点表示样本,配对样本间以连线连接。

这样,配对箱线图就获得了。

箱线图描述了组间基因表达水平改变的趋势,在该图中可以看到MAP2基因的表达在肿瘤组织和正常组织中是不一致的。后续如有需要,不妨执行配对样本的t检验等,计算显著性p值,作为评判基因表达显著差异的指标。

你就是在说哈希表吧,python中的dictionary,c++里的unordered map.

有包的,就叫hash,具体用法:

首先安装hash包,library()一下做好准备。

# 两句一样效果,键是26个小写英文字母,对应的值是1到26

h <- hash( keys=letters, values=1:26 )

h <- hash( letters, 1:26 )

# 读取方法三种

h$a

h[ "foo" ]

h[[ "foo" ]]

# 插入键值对

h$foo <- "bar"

# 删除变量h

clear(h)

rm(h)

在诊断试验中,研究者希望考察不同诊断方法在诊断结果上是否具有一致性,比如:不同医务工作者对同一组病人的诊断结果是否一致、不同的诊断方法对同一个样本或研究对象的化验结果是否一致等。Cohen 等提出用 Kappa 值作为评价一致性的指标,并得到了广泛的应用,本节将向大家介绍不同条件下的一致性检验。

用于一致性检验的方法取决于数据类型(属性数据,顺序数据,连续数据)以及需要检验的结果组数。

以下是 irr 包中的diagnoses 数据集的一部分,包括三个医生对 30 位病人的诊断结果。

两组结果一致性检验: Cohen’s Kappa

多组结果一致性检验: Fleiss’s Kappa, Conger’s Kappa

如果出现多个评分者,将使用Fleiss’s Kappa。

当然也可以使用Conger’s (1980) 的方法计算精确的Kappa。(注意:目前不知道这个方法效果相对于普通的是好是坏。)