r语言如何数据分析

Python012

r语言如何数据分析,第1张

r语言数据分析是查看数据的结构、类型,数据处理。根据查询相关资料信息显示:R语言是一个开源、跨平台的科学计算和统计分析软件包,具有丰富多样、强大的的统计功能和数据分析功能,数据可视化可以绘制直方图、箱型图、小提琴图等展示分数的分布情况可以通过散点图和线性拟合来展示分数和年龄之间的关系。

R语言支持的数据类型

数值型(numeric)

复数型(complex)

逻辑型(logical)

字符型(character)

R语言的数据对象类型包括:

标量(Scalar)

向量(Vector) :一个向量只能有一种数据类型

因子(Factor):一个因子只能有一种数据类型

矩阵(Matrix) :一个矩阵只能有一种数据类型

数组(Array) :一个数组里面的每个元素只能有一种数据类型,不同元素的类型可以不同

列表(List) :允许不同的数据类型

数据框(Data frame):不同的列的数据类型允许不同

查看数据特征:

1、数据的获取

1.1从excel中读取数据

需要加载包,通常有两种包

library(readxl)

library(readxl) # 读取数据,返回值是data.frame() mydata <- read_xlsx("D:/test/testdata.xlsx",sheet = 1) print(mydata$ID) class(mydata)

library(openxlsx)

library(openxlsx) mydata <- read.xlsx("D:/test/testdata.xlsx",sheet = 1)

1.2从CSV文件中获取

什么是CSV文件 ?:Comma-Separated Values,中文叫,逗号分隔值或者字符分割值,其文件 以纯文本的形式存储表格数据 。该文件是一个字符序列,可以由任意数目的记录组成,记录间以某种换行符分割。每条记录由字段组成,字段间的分隔符是其他字符或者字符串。所有的记录都有完全相同的字段序列,相当于一个结构化表的纯文本形式。

个人更加偏好csv格式的文件。

用文本文件、excel等软件都可以打开CSV文件。

读取csv中的数据