如何在R语言中读入数据和导出存储数据

Python06

如何在R语言中读入数据和导出存储数据,第1张

1.R数据的保存与加载

可通过save()函数保存为.Rdata文件,通过load()函数将数据加载到R中。

[ruby] view plain copy

> a <- 1:10

> save(a,file='d://data//dumData.Rdata')

> rm(a)   #将对象a从R中删除

> load('d://data//dumData.Rdata')

> print(a)

[1]  1  2  3  4  5  6  7  8  9 10

2.CSV文件的导入与导出

下面创建df1的数据框,通过函数write.csv()保存为一个.csv文件,然后通过read.csv()将df1加载到数据框df2中。

[ruby] view plain copy

> var1 <- 1:5

> var2 <- (1:5)/10

> var3 <- c("R and","Data Mining","Examples","Case","Studies")

> df1 <- data.frame(var1,var2,var3)

> names(df1) <- c("VariableInt","VariableReal","VariableChar")

> write.csv(df1,"d://data//dummmyData.csv",row.names = FALSE)

> df2 <- read.csv("d://data//dummmyData.csv")

> print(df2)

VariableInt VariableReal VariableChar

1           1          0.1        R and

2           2          0.2  Data Mining

3           3          0.3     Examples

4           4          0.4         Case

5           5          0.5      Studies

3.通过ODBC导入与导出数据

RODBC提供了ODBC数据库的连接。

3.1从数据库中读取数据

odbcConnect()建立一个数据库连接,sqlQuery()向数据库发送一个SQL查询,odbcClose()关闭数据库连接。

[ruby] view plain copy

library(RODBC)

connection <- odbcConnect(dsn="servername",uid="userid",pwd="******")

query <- "SELECT * FROM lib.table WHERE ..."

# or read query from file

# query <- readChar("data/myQuery.sql", nchars=99999)

myData <- sqlQuery(connection, query, errors = TRUE)

odbcClose(connection)

sqlSave()和sqlUpdate()用于写入或更新一个ODBC数据库表。

3.2从Excel文件中导入与导出数据

[ruby] view plain copy

library("RODBC")

conn<-odbcConnectExcel("D:/data/Amtrak.xls")

Amtrak<-sqlFetch(conn,"Data")

close(conn)

Vectors 向量【当你想用多个元素创建向量时,你应该使用 c() 函数,这意味着将元素组合成一个向量。】

# c函数用来将元素组成为一个向量

v <- c('a', 'b','c')

print(v)

# 输出结果即为元素的值,可以看出,vector类型里面只能有一种元素

print(class(v))

1

2

3

4

5

1

2

3

4

5

1] “a” “b” “c”

[1] “character”

那么问题来了,假如我就是想什么东西都往向量里面塞呢,这种做法并不会引发报错,但是R会暗中把那些乱七八糟的东西全部转换为一种类型。比如在下面这个例子,R就取了vector的第一个元素,将其转换为了character类型。

在这里插入图片描述

Lists 列表【列表是一个 R 对象,它可以在其中包含许多不同类型的元素,如向量,函数甚至其中的另一个列表。】

# 列表里面就什么都可以塞

l <- list(1,"666",c(2,3,4))

print(l)

print(class(l))

1

2

3

4

1

2

3

4

[[1]]

[1] 1

[[2]]

[1] “666”

[[3]]

[1] 2 3 4

[1] “list”

Matrices 矩阵【矩阵是二维矩形数据集。 它可以使用矩阵函数的向量输入创建。】

# 第一个参数指的是矩阵中的元素内容,第二三个参数指的是矩阵的行和列,最后一个参数指的是按行排列还是按列排列

M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE)

print(M)

M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = FALSE)

print(M)

print(class(M))

1

2

3

4

5

6

1

2

3

4

5

6

在这里插入图片描述

Arrays 数组【虽然矩阵被限制为二维,但阵列可以具有任何数量的维度。 数组函数使用一个 dim 属性创建所需的维数。】

a <- array(c(1,2,3,4),dim = c(3,3,2))

print(a)

print(class(a))

print(a[2,2,1])

1

2

3

4

1

2

3

4

在这里插入图片描述

Factors 因子【因子是使用向量创建的 r 对象。 它将向量与向量中元素的不同值一起存储为标签。 标签总是字符,不管它在输入向量中是数字还是字符或布尔等。 它们在统计建模中非常有用。】

color <- c('green','green','yellow','red','red','red','green')

f <- factor(color)

print(color)

print(f)

print(nlevels(f))

print(class(s))

1

2

3

4

5

6

1

2

3

4

5

6

在这里插入图片描述

Data Frames 数据帧【数据帧是表格数据对象。 与数据帧中的矩阵不同,每列可以包含不同的数据模式。 第一列可以是数字,而第二列可以是字符,第三列可以是逻辑的。 它是等长度的向量的列表。】

BMI <- data.frame(

gender = c("Male", "Male","Female"),

height = c(152, 171.5, 165),

weight = c(81,93, 78),

Age = c(42,38,26)

)

print(BMI)

print(class(BMI))

1

2

3

4

5

6

7

8

1

2

3

4

5

6

7

8

在这里插入图片描述

参考网址:w3c

打开CSDN,阅读体验更佳

R语言基础之第六部分 分类(史上最全含ddply、aggregate、split、b...

R语言基础之第六部分 分类(史上最全含ddply、aggregate、split、by) 数据: 某市2014年-2018年空气质量指数日数据,需要按年分类计算每年 warm值为1和 0的均值。 数据长这个样子: 目标:求下列的均值 一、数据处理(提取年月) 首先需要...

R语言:数据类型及属性_woooooood的博客

R语言:数据类型及属性 1.数据类型 R语言可以处理的数据类型主要有6种:数值型、整数型、字符型、复数型、逻辑型和原生型 若输入的数据为一个数字,则数据类型为数值型(numeric),若想数据类型为整数(integer),则需要在所赋值后加“L”...

二、数据集与数据类型【R与统计】

引言 按照要求格式来创建含有研究信息的数据集是任何数据分析的第一步。在R中,这个任务包括以下两步: 选择一种数据结构来存储数据; 将数据输入或导入到该数据结构中 因此,本文将先叙述了R中用于存储数据的多种结构,具体为向量、因子、矩阵、数据框以及列表的用法。熟悉这些数据结构和访问其中元素的表述方法将十分有助于了解R的工作方式,便于后续的编程。 我将在下一篇博客介绍一些在R中导入数据的可行方法。手工输入数据当然可以,除此之外,我们也可以从外部源导入数据。数据源可以是文本文件、电子表格、统计软件和各类数据库管

继续访问

R语言中的数据集

R语言中的数据存储形式主要有以下几种方式 数组,向量,矩阵,数据框,列表 R语言中的可以处理的数据类型有以下几种方式 数值类型,字符类型,逻辑类型,原声类型(二进制类型),复数类型 数值类型 包括 实例标示,日期类型 字符类型 包括 标称变量,序数变量 R语言针对不同的数据类型处理的方式是不同的 一、向量(每一个向量中的元素都是相同的数据类型) a b c

继续访问

最新发布 R语言基础数据类型

R语言主要有三种基本的数据类型,分别是数值型(Numeric)、整型(integer)以及字符型(character)。

继续访问

R语言数据类型基础1 数值型、逻辑型与文本型

基础的R语言数据类型操作,包括了字符串、数值向量以及逻辑向量的一点简单介绍

继续访问

R语言----对数据进行分类汇总(GROUP_BY使用)

library(dplyr) ###加载dplyr模块 A<-read.csv("f:\\TEST\\TDD.csv") ####加载数据 D=data.frame(A) ##### A1<-group_by(D,Date_ID) ####分组项 A2<-summarise(A1,cells=n(), ####统计个数 RRC_ch...

继续访问

R语言--R语言数据类型(2)

一、矩阵与数组 创建 # 1.1 利用array函数,创建二维数组m1,每一行记录不同人(A,B,C)的各科成绩(math,english,physics),成绩请随意输入(要求每行至少有一个90分以上,每一列至少有一个60分以下) print('----1.1') m1 <- array(c(95,40,80,55,92,98,86,93,55), dim = c(3,3), dimnames = list(c('A','B','C'),

继续访问

R语言之对象和类

理解什么是对象R是一种基于对象(object)的语言,所以我们在R语言中看到的一切事物都是对象,向量是对象,函数是对象,图形是对象。简单说,我们可以把整个R看成是一个储物室,它的内容是由内在不同的储物盒(对象)组成, 每个盒子有不同属性(attribute), 最重要的一种属性是它的类(class).查看、删除ls:list的缩写,我们要查看物品,所以要先列出目录。

继续访问

R语言中的类和对象

#####类和对象##### #之前学习的字符向量、数值向量、数据框、列表以及数组都是一个类。 #用class函数定义类 teams<-c("PHI","NYM","FLA","ATL","WSN") w<-c(92,89,94,72,59) l<-c(70,73,77,90,102) nleast<-data.frame(teams,w,l) #定义teams类 class(teams) cla

继续访问

R语言数据类型

文章目录基本概念向量字符串矩阵列表数组因子数据框 基本概念 R 语言中的最基本数据类型主要有三种:数字,逻辑,文本 逻辑类型在许多其他编程语言中常称为布尔型(Boolean),常量值只有 TRUE和FALSE。 注意:R 语言区分大小写,true 或 True 不能代表 TRUE。 最直观的数据类型就是文本类型。文本就是其它语言中常出现的字符串(String),常量用双引号包含。 在 R语言中,文本常量既可以用单引号包含,也可以用双引号包含,例如: 按对象类型来分是以下6种:向量(vector),列表(

继续访问

R语言分类汇总

R语言分类汇总 ##加载包 library(dplyr) ##函数 group_by 制定数据集 data 中针对 type 变量进行分类汇总 grou <- group_by(data,type) ##summarise函数计算分类结果——sd 标准差,还可计算其他类,分类汇总 type_sd <- summarise(grou ,sd(range ,na.rm = T)) dat...

继续访问

热门推荐 R语言:排序、筛选以及分类汇总操作

在Excel中我们可以很方便的对数据进行排序、筛选、分类汇总等基本操作,R语言中没有这种傻瓜式的一键操作,如何才能完成这种操作?一、排序1、单变量序列排序单变量序列的排序常用到rank、sort和order函数。给一个例子:>a <- c(3, 1, 5) >rank(a) [1] 2 1 3 >sort(a) [1] 1 3 5 >order(a...

继续访问

R语言 查看与转换数据类型

数据对象类型 R语言的对象常见的数据类型有:数值型、字符型、逻辑型、整数型、复数型等。此外,也可能是缺省值(NA) 数据对象类型及其判别和转化函数 类型 中文释义 示例 辨别 转换 numeric 数值型 2、-3、4.5 is.numeric() as.numeric() character 字符型 “ZhangHenghua” is.character() as.chara...

继续访问

R语言的数据类型

一、数据类型 概括来说,R可以识别六种基本的数据类型,分别是,双整型(double)、整型(integer)、字符型(character)、逻辑型(logical)、复数类型(complex)以及原始类型(raw). 1.双整型(double) 储存普通数值型数据,可正可负,可大可小,可含小数可不含 R中键入的任何一个数值都默认以double型存储 想知道某个对象是什么类型,可以使用typeof() 函数进行查看 在数据科学里,它更常被称为数值型(numeric) 2.整型(integer) 顾名思义,只能

继续访问

R语言——数据类型详解

R语言——数据类型详解 R语言支持的数据类型 数值型 整数型 逻辑型 字符型 复数型 原生型 R语言的数据对象类型包括 向量:一个向量只能有一种数据类型 矩阵:一个矩阵只能有一种数据类型 数组:一个数组只能有一种数据类型 数据框:不同的列允许不同的数据类型 因子:一个因子只能有一种数据类型 列表:允许不同的数据类型 如上图所示,标量、向量、矩阵和数组可以按同一类型来理解,这四种类型要求对象包含的数据均为同一类型,数组是多维度的一串数据,向量是维度为1的数组,标量是单元素的向量,矩阵是维度为2的数

继续访问

R语言自用笔记:复数

介绍了R语言中虚数的表示、相关函数

继续访问

[R语言]2. R语言中的数据类型和数据结构

R语言中数据类型和数据结构是两种不同的概念,初学者经常容易搞混,因此有必要对这两个概念进行详细说明。

继续访问

R语言数据类型:Logical、Numeric、Integer、Complex、Character、Vectors、Lists、Matrices、Arrays、Factors、DataFrames

R语言数据类型:Logical、Numeric、Integer、Complex、Character、Vectors、Lists、Matrices、Arrays、Factors、DataFrames 通常,在使用任何编程语言进行编程时,都需要使用各种变量来存储各种信息。变量只不过是用来存储值的内存位置或者区间。这意味着,当我们创建一个变量时,系统在内存中保留了一些空间。 我们可能喜欢存储各种数据类型的信息,如字符、宽字符、整数、浮点、双浮点、布尔等。根据变量的数据类型,操作系统进行内存的分配并

继续访问

R语言 常用数据类型

一般来讲,R语言中有三种数据结构,第一种是数组,第二种是列表,第三种是数据框。第一种: 数组(包括向量和矩阵)。数组可以用来储存数值型(numeric)、逻辑型(logical)和字符型(character)三种类型的数据。例如:储存字符型数据 >x = array(rep("a",6),dim=c(2,3)) >x [,1] [,2] [,3] [1,] "a" "a" "a"

#b站视频——R语言入门与数据分析

#内置数据集

#固定格式的数据(矩阵、数据框或一个时间序列等)

#统计建模、回归分析等试验需要找合适的数据集

#R内置数据集,存储在,通过

help(package="datasets")

#通过data函数访问这些数据集

data()

#得到新窗口  前面:数据集名字  后面:内容

#包含R所有用到的数据类型,包括:向量、矩阵、列表、因子、数据框以及时间序列等

#直接输入数据集的名字就可以直接使用这些数据集

#输出一个向量

rivers

#是北美141条河流长度

#这些数据集的名字都是内置的,一般我们在给变量命名时最好不要重复

#否则数据集在当前对话中会被置换掉

#例如

rivers<-c(1,2,3)

rivers

#不过影响不大

#再使用data函数重新加载这个数据集就可以了

data("rivers")

rivers

#一些常用内置数据集

#默认介绍页面只有名字和介绍,并没有给出数据分类

#哪些是向量、矩阵、数据框等?

#查看数据集除了直接敲数据集名字显示数据之外

#还可以使用help函数查看每个数据集具体的内容

help("mtcars")

euro

#欧元汇率,长度为11,每个元素都有命名

#输出向量的属性信息

names(euro)

#将5个数据构成一个数据框

向量

state.abb #美国50个州的双字母缩写

state.area #美国50个州的面积

state.name #美国50个州的全称

因子

state.division #美国50个州的分类,9个类别

state.region #美国50个州的地理分类

#

state<-data.frame(state.name,state.abb,state.area,state.division,state.region)

state

state.x77 #美国50个州的八个指标

state.x77

VADeaths #1940年弗吉尼亚州死亡率(每千人)

volcano #某火山区的地理信息(10米×10米的网格)

WorldPhones #8个区域在7个年份的电话总数

iris3 #3种鸢尾花形态数据

#以上矩阵→适合画热图

heatmap(volcano)

#这里只是作为一个演示,还需要对这个图进行一些调整

#更复杂的数据结构

Titanic #泰坦尼克乘员统计,是一个数组

UCBAdmissions #伯克利分校1973年院系、录取和性别的频数

crimtab #3000个男性罪犯左手中指长度和身高关系

HairEyeColor #592人头发颜色、眼睛颜色和性别的频数

occupationalStatus #英国男性父子职业联系

#类矩阵

eurodist #欧洲12个城市的距离矩阵,只有下三角部分

Harman23.cor #305个女孩八个形态指标的相关系数矩阵

Harman74.cor #145个儿童24个心理指标的相关系数矩阵

#R中内置最多的数据集——数据框

cars #1920年代汽车速度对刹车距离的影响

iris #3种鸢尾花形态数据

mtcars #32辆汽车在11个指标上的数据

rock #48块石头的形态数据

sleep #两药物的催眠效果

swiss #瑞士生育率和社会经济指标

trees #树木形态指标

USArrests #美国50个州的四个犯罪率指标

women #15名女性的身高和体重

#列表

state.center #美国50个州中心的经度和纬度

#类数据框

Orange #桔子树生长数据

#时间序列数据,和数据框类似,不同的是具有时间序列的顺序,是数据分析中非常常见的格式

#能反映出变化情况以及变化的趋势等

#因此有很多专门的方法用于时间序列的数据分析

co2 #1959-1997年每月大气co2浓度(ppm)

presidents #1945-1974年每季度美国总统支持率

uspop #1790–1970美国每十年一次的人口总数(百万为单位)

#除了内置数据集之外,许多R扩展包中也内置了很多数据集

#这些数据集作为扩展包的函数使用的案例

#加载R包之后这些数据集也同样被加载进来

#例如MASS包中的Cars93数据

#包含了27个变量,是1993年93辆汽车的型号指标

install.packages("MASS")

library("MASS")

help("Cars93")

#使用data函数在参数package中等于对应R包的名字,即可列出每个R包中包含的数据集

#ex

data(package="MASS")

#显示R中所有可用的数据集

data(package=.packages(all.available = TRUE))

#不加载R包使用其中的数据集

data(Chile,package="car")

Chile

#>data(Chile,package="car")

#Warning message:

#  In data(Chile, package = "car") : data set ‘Chile’ not found

#>Chile

#Error: object 'Chile' not found

install.packages("car")

library("car")

help("Chile")