如何用r语言进行数据分类

Python018

如何用r语言进行数据分类,第1张

R语言是用于统计分析、绘图的语言和操作环境。R语言是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可自定义功能。

R语言按照以下几点进行数据分类

通过选择菜单

程序包->安装程序包->在弹出的对话框中,选择你要安装的包,然后确定。

使用命令

install.packages("package_name","dir")package_name:是指定要安装的包名,请注意大小写。dir:包安装的路径。默认情况下是安装在..\library 文件夹中的。可以通过本参数来进行修改,来选择安装的文件夹。

本地来安装

如果你已经下载的相应的包的压缩文件,则可以在本地来进行安装。请注意在windows、unix、macOS操作系统下安装文件的后缀名是不一样的:

1)linux环境编译运行:tar.gz文件

2)windows 环境编译运行 :.zip文件

3)MacOSg环境编译运行:.tgz文件

加载包

包安装后,如果要使用包的功能。必须先把包加载到内存中(默认情况下,R启动后默认加载基本包),加载包命令:

Library(“包名”)

train_sub <- sample(nrow(data),0.7*nrow(data))##随机无回放抽取

train_set <- data[train_sub,]

test_set <- data[-train_sub,]##

可以这样来划分,把data改成你自己的数据名称就可以了