关于R语言。。。能解释下什么意思

Python020

关于R语言。。。能解释下什么意思,第1张

R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来新西兰奥克兰大学的Robert Gentleman和Ross Ihaka及其他志愿人员开发了一个R系统。

与其说R是一种统计软件,还不如说R是一种数学计算的环境,因为R并不是仅仅提供若干统计程序、使用者只需指定数据库和若干参数便可进行一个统计分析。R的思想是:它可以提供一些集成的统计工具,但更大量的是它提供各种数学计算、统计计算的函数,从而使使用者能灵活机动的进行数据分析,甚至创造出符合需要的新的统计计算方法。

扩展资料:

R可以看作贝尔实验室(AT&T BellLaboratories)的RickBecker,JohnChambers和AllanWilks开发的S语言的一种实现。当然,S语言也是S-Plus的基础。所以,两者在程序语法上可以说是几乎一样的,可能只是在函数方面有细微差别,程序十分容易地就能移植到一程序中,而很多一的程序只要稍加修改也能运用于R。

参考资料来源:百度百科-R语言

查看数据集的记录:如inspect(sort(x,by="support")[1:50]) 按照"support"排序后,查看前50个记录;inspect(y) 查看y数据集的所有记录。

1、数据的获取

1.1从excel中读取数据

需要加载包,通常有两种包

library(readxl)

library(readxl) # 读取数据,返回值是data.frame() mydata <- read_xlsx("D:/test/testdata.xlsx",sheet = 1) print(mydata$ID) class(mydata)

library(openxlsx)

library(openxlsx) mydata <- read.xlsx("D:/test/testdata.xlsx",sheet = 1)

1.2从CSV文件中获取

什么是CSV文件 ?:Comma-Separated Values,中文叫,逗号分隔值或者字符分割值,其文件 以纯文本的形式存储表格数据 。该文件是一个字符序列,可以由任意数目的记录组成,记录间以某种换行符分割。每条记录由字段组成,字段间的分隔符是其他字符或者字符串。所有的记录都有完全相同的字段序列,相当于一个结构化表的纯文本形式。

个人更加偏好csv格式的文件。

用文本文件、excel等软件都可以打开CSV文件。

读取csv中的数据