R语言一键制作Table 1，就是这么简单！

2023-02-27 08:29:01Python011

R语言一键制作Table 1，就是这么简单！,第1张

转自医学方

2019-07-4 Alexander

流行病学或者医学论文中，对研究对象基本情况的描述通常以表格的形式进行，并且放在结果部分的开头，即Table 1，主要内容是研究对象一般情况和研究变量或协变量的分组展示。

前几天文章修回过程中，花了两天时间分析数据，修改文章，其中有近1天的时间都在手动录入数据（从R studio里把分析结果整理到Excel或者word），这样除了花费时间外，还非常容易出错。之前一直想找时间通过R markdown把制作表格的过程程序化，可是效果并不理想。

这次痛定思痛，先从table 1开始，发现了几个不错的方法。其中一种个人觉得可读性和可编辑性都比较强，于是学习了一下，作为一个非常实用的工具分享给大家。

这里主要参考一篇博客Fast-track publishing using knitr: table mania，对细节进行了加工和注释。

1 数据的准备

数据主要来自于boot包的melanoma。加载后，看下数据的基本结构。

接下来对数据进行简单的整理，为后续分析做准备；

将分类变量定义为因子型并设置标签（这里建议设置一个新的变量，仅用于table 1的制作，不影响后续的分析）；

2 安装和加载R包 Gmisc

后面两个包是加载“Gmisc”时要求加载的。

3 自定义函数、制作表格

根据已有函数自定义函数，并制作表格。定义一个函数，输入数据集的变量并得到该变量的统计结果：

函数定义完成后，建立一个空的列表，以储存每个变量的分析结果，并进行分析，将结果储存在列表中：

将所有结果merge到一个矩阵中，并建立rgroup（table1第一列的变量名）和 n.rgroup（table 1第一列每个变量的行数）：

结果如下：

当然，有些情况下，需要多加一个分组标题栏（column spanner），该怎么加呢？

如下：

结果如下：

4 导出结果

在R studio viewer窗口点击白色按钮，即可在浏览器中打开，然后复制粘贴到word可以进一步加工修饰。

是不是很刺激呢。

应该还有其他的导出方法，不过这个已经很方便了。

拓展功能选

⒈ 二分类变量只显示一个（比如男性和女性）。只要在getDescriptionStatsBy的"show_all_values"参数设置为FALSE即可；

⒉ 显示缺失值。getDescriptionStatsBy的"useNA"参数设置为"ifany"，表示如果有缺失值就显示缺失值情况；如设置为“no”，表示始终不显示缺失值情况；“always”则表示无论是否有缺失值都显示缺失值情况；

⒊ Total一列是可以去掉的，getDescriptionStatsBy的"add_total_col"参数设置为FALSE即可。

不足之处

⒈ 差异性检验是采用非参的方法，虽然没有错，但是一般符合参数检验条件的数据还是要使用参数检验的方法，这里可以自行检验后再修改P-value；

⒉ Mean (SD)的展示形式有个括号感觉有点别扭，还不知道怎么去掉，有方法的小伙伴欢迎分享交流。

另外有一些其他的制作table 1的R包，比如table 1（R包的名字）包，tableone包，还有其他生成表格的R包（plyr等），个人浏览下来感觉这个最容易理解和掌握，其他包的功能有兴趣的可以再自行挖掘对比。

原文链接： https://mp.weixin.qq.com/s?src=11&timestamp=1562230826&ver=1707&signature=Og8lYPNfFi99QvnQb8OAtkTIo75N9G0JHqvpXxLS5aRpqRcnlgtxXJAMtfgxB8kAK8vinKSxdO6A1qxNy-4k8AyE9wUMYKSarBLDydWO-vazmCNPJIAa5GfaBiFIghaO&new=1

数据框名称=data.frame(列名1=数据，列名2=数据，....）

read.table（“文件名”，sep=“分割符号”，header=T第一行做列名rownames=1第一列为行名)

注意：csv分隔符为，txt分隔符为\t

write.table("文件名"，数据框，sep=“分隔符”,row.names=TRUE, col.names=NA)

解释：将b数据框导出为BMI.txt或BMI.csv

注意：最后row.names=TRUE, col.names=NA是为了输出数据框不错位

数据框$列名

解释提取test数据框中的height一列数据

解释：根据gender进行分组，检验组间height，数据来自数据框test

创建向量时，先给向量命名，如letters，名字后加“<-符号，接着写函数c（元素）”，如“letters <- c(a,b,c,2,5)”。输入"<-"的方法：同时按“alt和-”或先按"<"再按"-"。

向量只有一行，向量里元素的数据类型操作：class（向量名称[第几列]），如下：

给数据框的各列及各行命名，输入函数c（元素为数字直接输入，每个元素之间用逗号隔开，英文单词要加引号，再用逗号分开），按要求输入数据框的函数后，记得要输入数据框如resualtdata，才能在结果中把数据框的各行各列内容显示出来。

对数据框的各行和各列进的名称修改时，方法：rownames（数据框名字）<-(各列名之间要用引号，列名之间用逗号隔开)，colnames（数据框名字）<-(各行名之间要用引号，行名之间用逗号隔开)，最后再把数据框名字写上后运行。

第一种方法，class（数据框名称[,第几列]），第几行的数字是空白的；同理，确定数据框中各行的数据类型，class（数据框名称[第几行,]），第几列的数字是空白的。第二种方法，class(数据框名称$第几列的名称)，如下。

方法1:数据框名称 [第几行，第几列]；

方法2:数据框名称["第几行对应的名称","第几列对应的名称"]，此方法相应的行名和列名一定要加双引号，否者运行是错误的。

4行6列：矩阵名称<-matrix(1:24,nrow=4,ncol=6)

5行4列：矩阵名称<-matrix(1:20,nrow=5,ncol=4)

参考在数据框中更改各行各列命名的方法，注意的是，输入命名的函数后，运行不要从原始矩阵函数开始，不然会一直默认，应从矩阵名称开始，或者输入更改各行和各列的函数后，再输入矩阵名称，之后运行即可。

参考数据框的方法，同样也要注意在使用X["D3","E2"]方法时，一定要给具体的行和列的名称加引号。

在使用R语言时，输入的字母，符号一定是用英文版，当命令发生错误时，要仔细核对，是不是格式出现错误，显示不出结果时，输入相应的函数后，是不是没有输入数据框或矩阵。

将作业写至邮件 [email protected] ，抄送 [email protected]

数据名称函数方法变量

# 上一篇：C语言实验报告总结

# 下一篇：怎么用R语言求偶数的平均值

推荐阅读

热门文章

最新发布

标签列表

R语言一键制作Table 1，就是这么简单！

给您推荐相同类型的内容：