分层区组随机化及R语言实现(blockrand包)

Python018

分层区组随机化及R语言实现(blockrand包),第1张

可以看到,该课题根据性别及年龄两个层次最终把患者分为了4个亚组(统计学中,本文的年龄及性别称做分层名称,每个层内的分类成称为水平,既本研究有2个层,每个层2个水平)

分层随机化中,我们在进行分层后最终根据患者的不同特征把患者分为了各个亚组,再此分为了4个亚组,然后根据治疗方案(纳入治疗组还是对着组)对患者进行简单随机化。

但是,当总体样本量或每个亚组的样本量的不大时,在每个亚组进行简单随机化容易产生两组间治疗组及试验租的患者发生不平衡的情况(比如10个人随机分组,很容易出现一组7人一组3人的情况)。这时,我们可以引入区组随机化。比如,研究对象共计80例患者,所有层及水平均等分入组,每个亚组20例患者。如果对20例患者进行简单随机化很容易产生一组患者人多,一组患者人少的情况。这时候我们利用区组随机化,比如可以设定组的大小为4,强制前4个患者2个治疗组2个对照组,这样可以解决此类问题。

但是如果固定组的大小,每个组别的最后患者就会知道期分组情况,比如下图,固定区组大小为4,最后的患者再未进行分组前就能知道期为B治疗方案,不利于隐蔽分组的实现。

R语言中的blockrand包在对患者进行分层后,可以对每个层内的每个水平患者进行区组大小不固定的随机化,如下图

医科看到,前这四个患者的组大小为4,后续为2。而此分组大小是软件根据每个亚组的人数随机产生的。这样,就无法提前判断患者的入组情况。

详细说明网站

https://rdrr.io/cran/blockrand/man/blockrand.html

先选取一个随机数发生器。

随机数组合的方法:选取一个随机数发生器,生成1000个随机数,令这100个随机数生成数组并命名为t。同时令n=1,命名最终需要的随机数数组为x,选取第二个发生器,生成一个随机数j,且满足1而随机数组合的难点在于,步骤2步骤3的时候随机数种子的选取比较难。这里用的是第一个随机数发生器生成的随机数作为种子,也自己定义其他的种子。

次数分布表的基本步骤

1、求全距

全距用R表示,R=最大数 -

最小数。

2、定组数

定组数就是将全距分为若干组,一般分组以10-20组以下为宜。

3、求组距

组距就是每组的间隔,常以i表示,组距一般是相等的,组距的大小是由全距的长短以及组数的多少决定的。

4、定组限

组限是分组的界限,其最低数为下限,最高数为上限。

5、求组中值

每组的中点数值即称为组中值,它作为相应组限的代表数值。通常用Xc表示。

6、归类

当组距、组限、组中值确定后,就可以把原始数据一个一个地归类于适当组内,并统计出在每组限的次数,把结果列表显示。

随机区组实验设计优缺点

随机区组实验设计是根据“局部控制”的原则,将试验地按肥力程度划分为等于重复次数的区组,一区组安排一重复,区组内各处理都独立的随机排列。这是随机排列设计中最常用而最基本的设计。

1、随机单位组设计的主要优点 (1)设计与分析方法简单易行。(2)由于随机单位组设计体现了试验设计三原则,在对试验结果进行分析时,能将单位组间的变异从试验误差中分离出来,有效地降低了试验误差,因而试验的精确性较高。(3)把条件一致的供试动物分在同一单位组,再将同一单位组的供试动物随机分配到不同处理组内,加大了处理组之间的可比性。

2、随机单位组设计的主要缺点 当处理数目过多时,各单位组内的供试动物数也过多,要使各单位组内供试动物的初始条件一致将有一定难度,因而在随机单位组设计中,处理数以不超过20为宜。