前记:
正文:
第 一 部分: 5种数据对象类型
1.1 向量(vector)
1.2 矩阵(matrix)
向量+维度属性(nrow ncol)
1.3 数组(array)
与矩阵相似,但维度可大于2(说白了元素都是数 维度随便设)
1.4 列表(list)
可以包含不同类型
1.5 因子(factor)
整数向量+标签
1.6 缺失值(missing value)
NA:各种类型的缺失值
NAN:数值型的缺失值
NAN 属于 NA
is.na 和 is.nan 判断向量中是否有缺失值
1.7 数据框(data.frame)
存储表格数据,视为各元素长度相同的 列表
1.8 日期与时间(date, time)
日期
时间
POSIXct 整数 常用于存入数据框
POSIXIt 列表 还包括年月日等信息
后续请参考:
R语言基础之第 二 部分 : 操纵数据 取子集
R语言基础之第 三 部分:重要函数 apply族函数 的使用
R语言基础之第 四 部分 : 排序
R语言基础之第 五 部分 : 总结数据信息
常用R数据类型是向量
列表
矩阵
数组
因子
数据框
向量
当要创建具有多个元素的向量时,应该使用c()函数,表示将元素组合成一个向量。
>y<-c(12,13,14,15) >print(y)[1] 12 13 14 15
列表
列表是一个R对象,它可以包含许多不同类型的元素,如向量,函数,甚至其中的另一个列表。
>t<-list(a=c(1,2,3),b=c("yes","no"),c=c(12,13,14)) >print(t)$a[1] 1 2 3$b[1] "yes" "no" $c[1] 12 13 14
矩阵
矩阵是二维矩形数据集。 它可以使用向量输入到矩阵函数来创建。
>u<-matrix(c(2:10),ncol = 2) >print(u) [,1] [,2][1,] 2 7[2,] 3 8[3,] 4 9[4,] 5 10[5,] 6 2 数组
矩阵只能有两个维度,数组可以是任意数量的维数。数组函数采用一个dim属性,创建所需的维数。
>h<-array(c(3:8),dim = c(3,3,2)) >h, , 1 [,1] [,2] [,3][1,] 3 6 3[2,] 4 7 4[3,] 5 8 5, , 2 [,1] [,2] [,3][1,] 6 3 6[2,] 7 4 7[3,] 8 5 8 因子
因子是使用向量创建的R对象。 它将向量存储在向量中的元素的不同值作为标签。标签始终是字符,无论它是输入向量中是数字,还是字符或布尔等。它们在统计建模中很有用。
因子使用factor()函数创建。nlevels函数给出了级别的计数。
>factor<-c(1,2,3,4) >class(factor) [1] "numeric" >factor1<-as.factor(factor) >class(factor) [1] "numeric" >class(factor1) [1] "factor" 数据框
数据帧是表格数据对象。与数据帧中的矩阵不同,每列可以包含不同的数据模式。 第一列是数字,而第二列可以是字符,第三列可以是逻辑类型。它是一个长度相等的向量列表。
数据帧使用data.frame()函数创建。
>g<-data.frame(a=c(1,2,3),b=c("yes","no","yes"),c=c("male","female","male")) >g a b c1 1 yes male2 2 no female3 3 yes male