在linux服务器上使用R语言及Rstudio server cat /etc/redhat-release: 查看服务器系统版本 wget https://mirrors.tuna.tsinghua.edu.cn/CRAN/src/base/R-3/R-3.6.1.tar.gzchecking for rl_callback_read_char in -lreadline... no configure: error: --with-readline=yes (default) and headers/libs are not available configure: WARNING: you cannot build info or HTML versions of the R manuals configure: WARNING: you cannot build PDF versions of the R manuals configure: WARNING: you cannot build PDF versions of vignettes and help pages 6.安装 make make install 安装成功! R #在命令行直接输入“R”即可进入R 编辑。 q() ##退出R编辑 7.安装R-studio-server wget https://download2.rstudio.org/server/centos6/x86_64/rstudio-server-rhel-1.2.1335-x86_64.rpmyum install rstudio-server-rhel-1.2.1335-x86_64.rpm 8.R-studio-server的一些命令 rstudio-server start ##启动 rstudio rstudio-server stop ## 关闭rstudio rstudio-server status ## 查看rstudio 运行状态 运行rstudio-server status出现 “Active: active (running) ” 表示rstudio 已启动 rstudio-server verify-installation ## 查看rstudio 安装错误 rstudio-server restart ##重启 ifconfig ##查看服务器ip地址。 查看运行中R进程 rstudio-server active-sessions 指定PID,停止运行中的R进程 rstudio-server suspend-session <pid> 停止所有运行中的R进程 rstudio-server suspend-all 强制停止运行中的R进程,优先级最高,立刻执行 rstudio-server force-suspend-session <pid> rstudio-server force-suspend-all RStudio Server临时下线,不允许web访问,并给
用户友好提示 rstudio-server offline RStudio Server临时上线 rstudio-server online 8.rstudio-server系统设置 主要有两个配置
文件,默认文件不存在(非必要,可不做修改) /etc/rstudio/rserver.conf /etc/rstudio/rsession.conf vi /etc/rstudio/rserver.conf www-port=8080#监听端口,默认是8787,可以不做修改 www-address=127.0.0.0#允许访问的IP地址,默认0.0.0.0 rstudio-server restart vi /etc/rstudio/rsession.conf session-timeout-minutes=30#会话超时时间 r-cran-repos= http://ftp.ctex.org/mirrors/CRAN #CRAN资源库 rsession-which-r=/usr/local/bin/R ## 如果非root安装,更改R所在目录。 9.通过浏览器连接Rstudio-server 直接打开浏览器,输入http://<服务器ip>:8787 ## 如果修改过rserver.conf文件,后面的8787端口改为相应的端口即可。 这里需要我们输入用户名和密码。关于用户名有2点注意事项: (1).不允许使用system 用户登陆,即用户ids小于100的用户。只能用普通用户登录 (2).用户的认证可以使用RSA。 如果没有普通用户,可以添加: useradd newname # 添加一个名为newname的用户 passwd newname###给新用户newname 设置密码,密码需是复杂密码,否则可能通不过。 usermod -G happy newname ####将新用户newname添加到happy 用户组中, 在用useradd添加用户之后,在默认的情况下,该账号是暂时被封锁的, 也就是说,该账号是无法登录,须要用passwd命令来给新创建的用户设置密码之后才可以使用。 10可能存在的问题 10.1如果你的rstudio-server没有启动 很大程度是安装有误,这里我将我遇到的错误分享出来 rstudio-server verify-installation There is a libR.so in /usr/lib/R/lib, but (weirdly) ls -l reveals that it dates from the my previous install of R-3.5.1 for which I did notconfigure with --enable-R-shlib. 这里就提到无法找到libR.so文件,原因是配置R语言文件时,没有加参数--enable-R-shlib. 这就必须要重新安装R语言。使用make uninstall 删除之前的安装,最好也删除R-3.6.1所在的文件夹,用“rm -r -f R-3.6.1". 使用rm 命令 -r 参数表示全部删除, -f 参数表示强制删除,不会提醒。 同时使用这两个参数要小心。 10.2 普通用户无法启动rstudio-server sudo rstudio-server start## 以管理员方式执行命令 这时会需要输入密码并提示 xxx is not in the sudoers file.This incident will be reported. 如果不想出现上面的提示,就是给该用户提高权限,添加用户使用sudo的权利。 su root ###切换到root用户,如果有root权限的话。 chmod u+w /etc/sudoers ###添加sudo文件的写权限 vi /etc/sudoers ###编辑sudoers文件,添加权限。 找到这行 root ALL=(ALL) ALL,在他下面添加xxx ALL=(ALL) ALL (这里的xxx是你的用户名) youuserALL=(ALL)ALL %youuser ALL=(ALL)ALL youuserALL=(ALL)NOPASSWD: ALL %youuser ALL=(ALL)NOPASSWD: ALL chmod u-w /etc/sudoers ##撤销sudoers文件写权限R语言如何从外部读取
数据到R中
R语言可以从键盘,文本,excel,access,数据库,专业处理软件sas
一、使用键盘的输入
mydata<-data.frame(age=numeric(0),gender=character(0),weight=numeric(0))
mydata<-edit(mydata)
二、读入带有分隔符文本格式的数据
data<-read.table(文件,header=true/false,sep="delimeter",row.names=列名)
其中文件可以有很多选项的
file()gzfile(),bzfile(),等一些压缩文件以及url(http://,ftp://,smtp://)
例子:
默认的时候,字符串会自动使用factor转化为数值型
data<-read.table("student.csv",header=TRUE,sep=",",row.names="studentid",stringsAsFactors=FALSE)
三、将xls文件导入到R中
(1)将xls变成csv的格式导入
(2)在Windows系统中,你也可以使用RODBC包来访问Excel文件。
library(RODBC)
channel <- odbcConnectExcel("student.xls")
mydataframe<-sqlFetch(channel,"Sheet1")
odbcClose(channel)
四、抓取网页并且提取信息
五、导入spss数据
library(Hmisc)
mydata<-spss.get("mydata.sav",use.value.labels=TRUE)
六、导入SAS数据
将sas格式的数据转换为csv格式的数据 然后用read.table()形式导入
七、导入关系型数据库的数据
R中有多种面向关系型数据库管理系统(DBMS)的接口,包括Microsoft SQL Server、Microsoft Access、MySQL、Oracle、PostgreSQL、DB2、Sybase、Teradata以及SQLite。其中一些包通过原生的数据库驱动来提供访问功能,另一些则是通过ODBC或JDBC来实现访问的。
(1)使用ODBC的方式导入数据
1、下载Rtools
Rtools的下载点是:
Please choose a CRAN mirrornear you, and follow the "Download R for Windows" link to
<CRAN mirror>/bin/windows/Rtools
找到CRAN镜像的网址:
China
http://ftp.ctex.org/mirrors/CRAN/CTEX.ORG
http://cran.csdb.cn/Computer Network Information Center, CAS, Beijing
http://mirror.bjtu.edu.cn/cranBeijing Jiaotong University, Beijing
http://cran.dataguru.cnDataguru (a, Guangzhou
http://mirrors.ustc.edu.cn/CRAN/University of Science and Technology of China
http://mirrors.xmu.edu.cn/CRAN/Xiamen University
在网址后面添加/bin/windows/Rtools 即可
比如: http://cran.csdb.cn/bin/windows/Rtools/
我们下载最新版:Rtools215.exe
2、安装Rtools
安装的过程很傻瓜,不过有一点要注意:这个选项必须要选中,否则不会自动添加环境变量的
安装完成之后,打开一个cmd窗口,输入gcc --help,无误则说明环境变量设置正确。有的时候需要重启计算机,环境变量才生效
注意:我安装的Rtools是没有perl和TeX的
3、编写包
假设我们有自定义函数f1和f2以及数据矩阵d1,将其做成package,名字为test1,使用package.skeleton会在工作路径下自动生成package的框架。如下所示:
setwd("D:/RData/workdir")
f1 <- function(aa){return (aa)}
f2 <- function(aa){return(aa+2)}
d1 <- matrix(1:6,2,3)
package.skeleton(name="test1", list=c("f1","f2","d1"))
我们会在D:\RData\workdir内发现新生成了文件夹test1,里面包含data、man和R三个子文件夹以及DESCRIPTION和Read-and-delete-me这两个文件。其中Read-and-delete-me可以通过文本工具打开阅读后删除,DESCRIPTION可以参照标准的规范进行修改后保存(不做修改也不影响正常运行)。data文件夹保存数据(本例中对应d1),R文件夹保存函数(本例中对应f1和f2),man文件夹存放.Rd文件,用来生成帮助文件。我们只需要修改每个.Rd文件就行,用文本工具打开并定位到“title”开头这一行,写入该函数或者数据的名称即可(比如d1),保存关闭。其实按照标准的做法,下面的description和examples之类的都要补全,但是只有title是必须补全的,否则编译会出错。
修改title这块:
原始数据是:
\title{
What the package does (short line)
~~ package title ~~
}
我修改为:
\title{
my test r package
}
4、编译包
打开CMD,定位到D:\RData\workdir,进行编译,如下所示:
D:
cd D:\RData\workdir
Rcmd build test1
注意:如果没有把R语言的路径添加到环境变量中,运行Rcmd是会报错的,这时有两个办法:
A。把Rcmd.exe所在路径添加到系统路径中
B。运行时添加Rcmd.exe的全路径,比如:
"C:\Program Files\R\R-2.15.0\bin\i386\Rcmd.exe" build test1
运行之后,查看D:\RData\workdir 目录下多了一个文件:
test1_1.0.tar.gz
(注意,按照之前帖子里的说法是运行Rcmd build --binary test1 之后会生成zip文件,但是我添加了--binary参数之后报错,最终生成的也是tar.gz格式的,不知道是为什么)
tar.gz格式的无法RGui环境中直接添