1.R数据的保存与加载
可通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中。
[ruby] view plain copy
> a <- 1:10
> save(a,file='d://data//dumData.Rdata')
> rm(a) #将对象a从R中删除
> load('d://data//dumData.Rdata')
> print(a)
[1] 1 2 3 4 5 6 7 8 9 10
2.CSV文件的导入与导出
下面创建df1的数据框,通过函数write.csv()保存为一个.csv文件,然后通过read.csv()将df1加载到数据框df2中。
[ruby] view plain copy
> var1 <- 1:5
> var2 <- (1:5)/10
> var3 <- c("R and","Data Mining","Examples","Case","Studies")
> df1 <- data.frame(var1,var2,var3)
> names(df1) <- c("VariableInt","VariableReal","VariableChar")
> write.csv(df1,"d://data//dummmyData.csv",row.names = FALSE)
> df2 <- read.csv("d://data//dummmyData.csv")
> print(df2)
VariableInt VariableReal VariableChar
1 1 0.1 R and
2 2 0.2 Data Mining
3 3 0.3 Examples
4 4 0.4 Case
5 5 0.5 Studies
3.通过ODBC导入与导出数据RODBC提供了ODBC数据库的连接。
3.1从数据库中读取数据
odbcConnect()建立一个数据库连接,sqlQuery()向数据库发送一个SQL查询,odbcClose()关闭数据库连接。
[ruby] view plain copy
library(RODBC)
connection <- odbcConnect(dsn="servername",uid="userid",pwd="******")
query <- "SELECT * FROM lib.table WHERE ..."
# or read query from file
# query <- readChar("data/myQuery.sql", nchars=99999)
myData <- sqlQuery(connection, query, errors = TRUE)
odbcClose(connection)
sqlSave()和sqlUpdate()用于写入或更新一个ODBC数据库表。3.2从Excel文件中导入与导出数据
[ruby] view plain copy
library("RODBC")
conn<-odbcConnectExcel("D:/data/Amtrak.xls")
Amtrak<-sqlFetch(conn,"Data")
close(conn)
mutate:变异 突变 改变 数据修改
紧接着创建新的列gain和speed
新创建的列同时也可以使用(但是保留的方法仍然是赋值给某个名称):
由于系统显示限制,最后一列没有展示出来,运行view()函数即可:
如果只想要保留新的变量,那就使用transmute()函数:
此时参与计算的arr_delay、dep_delay、air_time、hours都消失,只有新转换的gain、hours 、gain_per_hour三列。
mutare()函数可以和前面提到的几个函数结合起来使用。其中进行运算的时候,肯定会涉及到R语言的计算语言,以下列出几个常用的:
举例: