R语言基础之第一部分 5种数据对象类型

Python046

R语言基础之第一部分 5种数据对象类型,第1张

前记:

正文:

部分: 5种数据对象类型

1.1 向量(vector)

1.2 矩阵(matrix)

向量+维度属性(nrow ncol)

1.3 数组(array)

与矩阵相似,但维度可大于2(说白了元素都是数 维度随便设)

1.4 列表(list)

可以包含不同类型

1.5 因子(factor)

整数向量+标签

1.6 缺失值(missing value)

NA:各种类型的缺失值

NAN:数值型的缺失值

NAN 属于 NA

is.na 和 is.nan 判断向量中是否有缺失值

1.7 数据框(data.frame)

存储表格数据,视为各元素长度相同的 列表

1.8 日期与时间(date, time)

日期

时间

POSIXct 整数 常用于存入数据框

POSIXIt 列表 还包括年月日等信息

后续请参考:

R语言基础之第 部分 : 操纵数据 取子集

R语言基础之第 部分:重要函数 apply族函数 的使用

R语言基础之第 部分 : 排序

R语言基础之第 部分 : 总结数据信息

R语言中的几种数据结构

一 R中对象的5种基本类型

字符(character)

整数 (integer)

复数(complex)

逻辑(logical:True/False)

数值(numeric:real numbers)

查看对象类型的命令:class(x)

二 R语言中有如下几种数据结构:

向量 vector() 组内元素必须类型一致,否则将会被强制转换。

(1) 创建向量的三种方式:

<span style="font-size:18px">x <- vector("numeric", length = 10)

x <- 1:4

x <- c("a",12,TRUE)</span>

(2) 强制转换的几个函数:

as.numeric(x) / as.character(x) / as.logical(x)

矩阵 matrix()一列一列的填充元素

按行合并:rbind()按列合并:cbind()

数组 array() 可以有多个维度

列表 list() 可以包含不同类型的元素

因子 factor()

(1) 分类数据/有序 vs. 无序

(2) 整数向量+标签(label)(优于整数向量)

Male/Female vs. 1/2

常用于lm(),glm()

(3) levels设置基线水平

table() 查看因子信息unclass() 去除因子属性日期

x <- Sys.Date() 得到系统当前日期

julian(x) x距离1970-01-01的天数

时间 POSIXct / POSIXlt

POSIXct:整数,常用于存入数据框 as.POSIXct()

POSIXlt:列表,还包含星期、年月日等信息。as.POSIXlt()

strptime(x, format = "...") 将一般格式转化为时间格式