r语言如何数据分析

Python020

r语言如何数据分析,第1张

r语言数据分析是查看数据的结构、类型,数据处理。根据查询相关资料信息显示:R语言是一个开源、跨平台的科学计算和统计分析软件包,具有丰富多样、强大的的统计功能和数据分析功能,数据可视化可以绘制直方图、箱型图、小提琴图等展示分数的分布情况可以通过散点图和线性拟合来展示分数和年龄之间的关系。

可以看到,该课题根据性别及年龄两个层次最终把患者分为了4个亚组(统计学中,本文的年龄及性别称做分层名称,每个层内的分类成称为水平,既本研究有2个层,每个层2个水平)

分层随机化中,我们在进行分层后最终根据患者的不同特征把患者分为了各个亚组,再此分为了4个亚组,然后根据治疗方案(纳入治疗组还是对着组)对患者进行简单随机化。

但是,当总体样本量或每个亚组的样本量的不大时,在每个亚组进行简单随机化容易产生两组间治疗组及试验租的患者发生不平衡的情况(比如10个人随机分组,很容易出现一组7人一组3人的情况)。这时,我们可以引入区组随机化。比如,研究对象共计80例患者,所有层及水平均等分入组,每个亚组20例患者。如果对20例患者进行简单随机化很容易产生一组患者人多,一组患者人少的情况。这时候我们利用区组随机化,比如可以设定组的大小为4,强制前4个患者2个治疗组2个对照组,这样可以解决此类问题。

但是如果固定组的大小,每个组别的最后患者就会知道期分组情况,比如下图,固定区组大小为4,最后的患者再未进行分组前就能知道期为B治疗方案,不利于隐蔽分组的实现。

R语言中的blockrand包在对患者进行分层后,可以对每个层内的每个水平患者进行区组大小不固定的随机化,如下图

医科看到,前这四个患者的组大小为4,后续为2。而此分组大小是软件根据每个亚组的人数随机产生的。这样,就无法提前判断患者的入组情况。

详细说明网站

https://rdrr.io/cran/blockrand/man/blockrand.html