数值型(numeric)
复数型(complex)
逻辑型(logical)
字符型(character)
R语言的数据对象类型包括:
标量(Scalar)
向量(Vector) :一个向量只能有一种数据类型
因子(Factor):一个因子只能有一种数据类型
矩阵(Matrix) :一个矩阵只能有一种数据类型
数组(Array) :一个数组里面的每个元素只能有一种数据类型,不同元素的类型可以不同
列表(List) :允许不同的数据类型
数据框(Data frame):不同的列的数据类型允许不同
查看数据特征:
1、数据的获取1.1从excel中读取数据
需要加载包,通常有两种包
library(readxl)
library(readxl) # 读取数据,返回值是data.frame() mydata <- read_xlsx("D:/test/testdata.xlsx",sheet = 1) print(mydata$ID) class(mydata)
library(openxlsx)
library(openxlsx) mydata <- read.xlsx("D:/test/testdata.xlsx",sheet = 1)
1.2从CSV文件中获取
什么是CSV文件 ?:Comma-Separated Values,中文叫,逗号分隔值或者字符分割值,其文件 以纯文本的形式存储表格数据 。该文件是一个字符序列,可以由任意数目的记录组成,记录间以某种换行符分割。每条记录由字段组成,字段间的分隔符是其他字符或者字符串。所有的记录都有完全相同的字段序列,相当于一个结构化表的纯文本形式。
个人更加偏好csv格式的文件。
用文本文件、excel等软件都可以打开CSV文件。
读取csv中的数据