如何在linux环境下使用r语言

Python011

如何在linux环境下使用r语言,第1张

1、下载

wget http://mirror.bjtu.edu.cn/cran/src/base/R-3/R-3.0.1.tar.gz

2、解压:

tar -zxvf

R-3.0.1.tar.gz

cd R-3.0.1

3、安装 (当然也可以跳过)

yum

install readline-devel

yum install libXt-devel

./configure

4、 配置环境并编译安装

#

如果使用rJava需要加上 --enable-R-shlib

(这个我不需要,所以加入到后面)

# 如果3没安装, 那么后面加上: --with-readline=no

--with-x=no

./configure --prefix=/usr/R-3.0.1

make $$ make install

5、配置环境变量并生效

vi

.bash_profile

export R_HOME=/usr/R-3.0.1

export PATH=.:$R_HOME/bin:$PATH

# 试环境变量生效

source .bash_profile

6、 命令行测试

[admin@JD

software]$ R

WARNING: ignoring environment value of R_HOME

R version 3.0.1 (2013-05-16) -- "Good Sport"

Copyright (C) 2013 The R Foundation for Statistical Computing

Platform: x86_64-unknown-linux-gnu (64-bit)

R是自由软件,不带任何担保。

在某些条件下你可以将其自由散布。

用'license()'或'licence()'来看散布的详细条件。

R是个合作计划,有许多人为之做出了贡献.

用'contributors()'来看合作者的详细情况

用'citation()'会告诉你如何在出版物中正确地引用R或R程序包。

用'demo()'来看一些示范程序,用'help()'来阅读在线帮助文件,或

用'help.start()'通过HTML浏览器来看帮助文件。

用'q()'退出R.

>q()

7、创建脚本测试(t.R)

cd

/opt/script/R

vim t.R

#!/path/to/Rscript

#第一行

x<-c(1,2,3)

#R语言代码

y<-c(102,299,301)

model<-lm(y~x)

summary(model)

8、测试:执行脚本

R CMD BATCH

--args /opt/script/R/t.R

more

/opt/script/R/t.Rout

#查看执行的结果

或者第二种方式

Rscript

/opt/script/R/test.R

#结果直接输出到终端

1. 安装和加载包

绘制Kaplan-Meier生存曲线需要用到的R包:survminer和survival。

library(survminer) # 加载包

library(survival) # 加载包

2 拟合曲线

R中使用survfit()函数来拟合生存曲线。

fit.3<-survfit(Surv(住院天数+病程,组别)~cd1656,data=data)

3. 绘制曲线函数

ggsurvplot(fit, data = NULL, fun = NULL, color = NULL,

          palette = NULL, linetype = 1, conf.int = FALSE,

          pval = FALSE, pval.method = FALSE,

          test.for.trend = FALSE, surv.median.line = "none",

          risk.table = FALSE, cumevents = FALSE,

          cumcensor = FALSE, tables.height = 0.25,

          group.by = NULL, facet.by = NULL, add.all = FALSE,

          combine = FALSE, ggtheme = theme_survminer(),

          tables.theme = ggtheme, ...)

# 参数解释

fit # 拟合的生存曲线对象

data # 用来拟合生存曲线的数据集

fun  # 常用三个字符参数;

# "event"绘制累积事件(f(y)=1-y),

# "cumhaz"绘制累积危害函数(f(y)=-log(y))

# "pct"绘制生存概率(百分比)。

color # 设置生存曲线的颜色。

# 如果只有1条曲线,则直接设置color="blue";

# 如果有多条曲线,默认color="strata",按分组为生存曲线着色;

# 也可以自定义调色板来设置曲线颜色。

palette # 调色板,默认"hue"。

# 可选调色板有"grey","npg","aaas","lancet",

# "jco", "ucscgb","uchicago","simpsons"和"rickandmorty".

linetype = 1 # 设置曲线线型。可以按"strata"设置线型;

# 或按数字向量c(1, 2)或按字符向量c("solid", "dashed")设置

conf.int # 逻辑词;默认FASLE;为TRUE则绘制曲线置信区间

pval = FALSE # 逻辑词;为TRUE则将统计检验计算的p值添加到图上;

# 为数字,则直接指定P值大小,如pval = 0.03;

# 为字符串,则添加字符串到图上,如pval = "p-value: 0.031"

pval.method  # 逻辑词,是否添加计算p值的统计方法的文本;

# 只有当 pval = TRUE时, 才会在图上添加检验方法文本

test.for.trend # 逻辑词,默认为FALSE;

# 为TRUE则返回趋势p值的检验,趋势检验旨在检验生存曲线的有序差异

surv.median.line # 在中位生存时间点处绘制水平或垂直线的字符向量;

# 可用值有"none"、"hv"、"h"、"v";其中v绘制垂直线,h绘制水平线。

risk.table = FALSE  # 逻辑词,图上是否添加风险表;

# "absolute" 显示处于风险中的绝对数量;

# "percentage" 显示处于风险中的百分比数量

# "abs_pct" 显示处于风险中的绝对数量和百分比

cumevents # 逻辑词,是否添加累计事件表

cumcensor # 逻辑词,是否添加累计删失表

tables.height = 0.25 # 生存曲线图下所有生存表的高度,数值0-1之间

group.by  # 包含分组变量名称的字符向量,向量长度≤2

facet.by # 字符向量,指定绘制分面生存曲线的分组变量(应≤2)的名称

ggtheme=theme_survminer() # 设置ggplot2主题,如theme_bw()

tables.theme # 作用于生存表的ggplot2主题名称

# 有theme_survminer、theme_cleantable()

add.all = FALSE # 逻辑词;是否添加总患者生存曲线到主生存图中