前记:
正文:
第 一 部分: 5种数据对象类型
1.1 向量(vector)
1.2 矩阵(matrix)
向量+维度属性(nrow ncol)
1.3 数组(array)
与矩阵相似,但维度可大于2(说白了元素都是数 维度随便设)
1.4 列表(list)
可以包含不同类型
1.5 因子(factor)
整数向量+标签
1.6 缺失值(missing value)
NA:各种类型的缺失值
NAN:数值型的缺失值
NAN 属于 NA
is.na 和 is.nan 判断向量中是否有缺失值
1.7 数据框(data.frame)
存储表格数据,视为各元素长度相同的 列表
1.8 日期与时间(date, time)
日期
时间
POSIXct 整数 常用于存入数据框
POSIXIt 列表 还包括年月日等信息
后续请参考:
R语言基础之第 二 部分 : 操纵数据 取子集
R语言基础之第 三 部分:重要函数 apply族函数 的使用
R语言基础之第 四 部分 : 排序
R语言基础之第 五 部分 : 总结数据信息
R语言中的几种数据结构一 R中对象的5种基本类型
字符(character)
整数 (integer)
复数(complex)
逻辑(logical:True/False)
数值(numeric:real numbers)
查看对象类型的命令:class(x)
二 R语言中有如下几种数据结构:
向量 vector() 组内元素必须类型一致,否则将会被强制转换。
(1) 创建向量的三种方式:
<span style="font-size:18px">x <- vector("numeric", length = 10)
x <- 1:4
x <- c("a",12,TRUE)</span>
(2) 强制转换的几个函数:
as.numeric(x) / as.character(x) / as.logical(x)
矩阵 matrix()一列一列的填充元素
按行合并:rbind()按列合并:cbind()
数组 array() 可以有多个维度
列表 list() 可以包含不同类型的元素
因子 factor()
(1) 分类数据/有序 vs. 无序
(2) 整数向量+标签(label)(优于整数向量)
Male/Female vs. 1/2
常用于lm(),glm()
(3) levels设置基线水平
table() 查看因子信息unclass() 去除因子属性日期
x <- Sys.Date() 得到系统当前日期
julian(x) x距离1970-01-01的天数
时间 POSIXct / POSIXlt
POSIXct:整数,常用于存入数据框 as.POSIXct()
POSIXlt:列表,还包含星期、年月日等信息。as.POSIXlt()
strptime(x, format = "...") 将一般格式转化为时间格式