如何用r语言抓取数据库中的数据库

Python016

如何用r语言抓取数据库中的数据库,第1张

一、 安装RODBC库

1、进入R语言的GUI界面(RGUI.EXE),在菜单栏选择“程序包/安装程序包

2、在弹出的窗口里往下拉,选择RODBC如图,点击确定

3、在ODBC数据源管理器里将需要的数据库添加进去,这里笔者使用的是SQL Server2008,驱动程序选择Native Client10.0

3、在R语言窗口输入连接语句

>library(RODBC)

**这里是载入RODBC库

>channel<-odbcConnect("MyTest",uid="ripley",case="tolower")

**连接刚才添加进数据源的“MyTest”数据库

**ch <- odbcConnect("some dsn ", uid = "user ", pwd = "**** ")

**表示用户名为user,密码是****,如果没有设置,可以直接忽略

>data(USArrests)

**将“USArrests”表写进数据库里(这个表是R自带的)

>sqlSave(channel,USArrests,rownames = "state",addPK = TRUE)

**将数据流保存,这时候打开SQL Server就可以看到新建的USArrests表了

>rm(USArrests)

>sqlTables(channel)

**给出数据库中的表

>sqlFetch(channel,"USArrests",rownames = "state")

**输出USArrests表中的内容

>sqlQuery(channel,"select * from USArrests")

**调用SELECT查询语句并返回结果(如图)

>sqlDrop(channel,"USArrests")

**删除表

>odbcClose(channel)

**最后要记得关闭连接

当然,通过这个办法也可以读取Excel、Access表中的内容,具体方法类似,这里不再重复

R语言可以使用read.xlsx()函数来读取excel数据文件,也可以使用read.csv()函数来读取csv格式的数据文件。此外,还可以使用R包RODBC来连接数据库,从而将数据文件存储在数据库中,便于管理和操作。另外,还可以使用R语言的XML包来解析XML格式的数据文件,从而将其导入R语言中进行处理分析。

首先在开始菜单打开控制面板。点击开始,选择右侧的控制面板。

在控制面板中,以所有控制面板的格式查看,选择管理工具,并打开。

在管理工具中,可以看到有个数据源(ODBC),打开数据源。

在数据源管理面板中,选择添加,由于我这里已经添加了一个数据源,只是介绍一下操作。

根据自己的数据库,选择相应的驱动,比如我这里是MYSQL ODBC 5.3。点击完成,进行下一步的配置。

这里根据提示,填写相应的字段即可。最后点击OK,由于这里没有填写任何字段,所以OK按钮是灰色的。

打开R软件,数据源设置好了之后,还要加载RODBC包。如果没有安装,参考经验“R语言关于R包的管理:安装加载查看,移除,卸载”。回车之后没有错误提示便是成功了。