R语言一键制作Table 1,就是这么简单!

Python044

R语言一键制作Table 1,就是这么简单!,第1张

转自医学方

2019-07-4 Alexander

流行病学或者医学论文中,对研究对象基本情况的描述通常以表格的形式进行,并且放在结果部分的开头,即Table 1,主要内容是研究对象一般情况和研究变量或协变量的分组展示。

前几天文章修回过程中,花了两天时间分析数据,修改文章,其中有近1天的时间都在手动录入数据(从R studio里把分析结果整理到Excel或者word),这样除了花费时间外,还非常容易出错。之前一直想找时间通过R markdown把制作表格的过程程序化,可是效果并不理想。

这次痛定思痛,先从table 1开始,发现了几个不错的方法。其中一种个人觉得可读性和可编辑性都比较强,于是学习了一下,作为一个非常实用的工具分享给大家。

这里主要参考一篇博客Fast-track publishing using knitr: table mania,对细节进行了加工和注释。

1 数据的准备

数据主要来自于boot包的melanoma。加载后,看下数据的基本结构。

接下来对数据进行简单的整理,为后续分析做准备;

将分类变量定义为因子型并设置标签(这里建议设置一个新的变量,仅用于table 1的制作,不影响后续的分析);

2 安装和加载R包 Gmisc

后面两个包是加载“Gmisc”时要求加载的。

3 自定义函数、制作表格

根据已有函数自定义函数,并制作表格。定义一个函数,输入数据集的变量并得到该变量的统计结果:

函数定义完成后,建立一个空的列表,以储存每个变量的分析结果,并进行分析,将结果储存在列表中:

将所有结果merge到一个矩阵中,并建立rgroup(table1第一列的变量名) 和 n.rgroup(table 1第一列每个变量的行数):

结果如下:

当然,有些情况下,需要多加一个分组标题栏(column spanner),该怎么加呢?

如下:

结果如下:

4 导出结果

在R studio viewer窗口点击白色按钮,即可在浏览器中打开,然后复制粘贴到word可以进一步加工修饰。

是不是很刺激呢。

应该还有其他的导出方法,不过这个已经很方便了。

拓展功能选

⒈ 二分类变量只显示一个(比如男性和女性)。只要在getDescriptionStatsBy的"show_all_values"参数设置为FALSE即可;

⒉ 显示缺失值。getDescriptionStatsBy的"useNA"参数设置为"ifany",表示如果有缺失值就显示缺失值情况;如设置为“no”,表示始终不显示缺失值情况;“always”则表示无论是否有缺失值都显示缺失值情况;

⒊ Total一列是可以去掉的,getDescriptionStatsBy的"add_total_col"参数设置为FALSE即可。

不足之处

⒈ 差异性检验是采用非参的方法,虽然没有错,但是一般符合参数检验条件的数据还是要使用参数检验的方法,这里可以自行检验后再修改P-value;

⒉ Mean (SD)的展示形式有个括号感觉有点别扭,还不知道怎么去掉,有方法的小伙伴欢迎分享交流。

另外有一些其他的制作table 1的R包,比如table 1(R包的名字)包,tableone包,还有其他生成表格的R包(plyr等),个人浏览下来感觉这个最容易理解和掌握,其他包的功能有兴趣的可以再自行挖掘对比。

原文链接: https://mp.weixin.qq.com/s?src=11&timestamp=1562230826&ver=1707&signature=Og8lYPNfFi99QvnQb8OAtkTIo75N9G0JHqvpXxLS5aRpqRcnlgtxXJAMtfgxB8kAK8vinKSxdO6A1qxNy-4k8AyE9wUMYKSarBLDydWO-vazmCNPJIAa5GfaBiFIghaO&new=1

前一段工作太忙了,终于又有时间来继续学习了

列表就是一些对象(或成分,component)的有序集合。列表允许整合若干(可能无关)对象到单个对象名下。也就是说,某个列表中,可能是托干个向量、矩阵、数据框,甚至是其他列表的组合。函数list()可创建列表。

下面创建一个列表

上述例子创建了一个列表,其中有四个成分:一个字符串、一个数值型向量、一个矩阵以及一个字符型向量。可以任意组合任意多的对象,并将它们保存为一个列表。

注意:可以通过双重括号知名代表某个成分的数字或者名称来访问列表中的元素。

列表允许以一种简单的方式组织和重新调用不相干的信息。其次,许多R函数的运行结果都是以列表的形式返回的。

一些小tips:

1、对象名称中的句点   .    没有特殊意义,但$ 和其他语言中句点有相似的意义,即指定一个数据框或列表中的某些部分。例如,A$x是指数据框A中的变量x。

2、R不提供多行注释或者是块注释功能。

3、将一个值赋予某个向量、矩阵、数组或者列表中一个不存在的元素时,R将自动扩展这个数据结构以容纳新值。

4、R中没有标量。标量以单元素向量的形式出现。

5、R中的下标不从0开始,而是从1开始。

6、变量无法被生命。他们在首次被赋值时生成。

《R语言4.0.4软件》百度网盘资源免费下载:

链接: https://pan.baidu.com/s/160twe4ScMvIbGm2TI_sjHw

?pwd=3ts7 提取码: 3ts7

R语言4.0.4是一款专业的统计建模软件,与其它建模软件不同的是这款软件完全免费、开源,所以深受大家的青睐。R软件拥有数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图等多种功能,主要用于统计分析、绘图、数据挖掘。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。