基础-R内置数据集

Python017

基础-R内置数据集,第1张

Preleminary tasks

List of pre-loaded data

Loading a built-in R data

Most used R built-in data sets

mtcars: Motor Trend Car Road Tests

iris

ToothGrowth

PlantGrowth

USArrests

Summary

R附带了几个内置的数据集,这些数据集通常用作演示数据,用于演示R函数。

在本文中,我们将首先描述如何加载和使用R内置数据集。接下来,我们将描述一些最常用的R demo数据集:mtcars、iris、ToothGrowth、PlantGrowth和USArrests。

预备工作

运行RStudio并设置工作目录

预加载数据列表

要查看预加载数据的列表,请键入函数 data():

>data()

输出如下:

加载内置R数据

加载并输出mtcars数据,如下所示:

#加载

>data(mtcars)

#打印前6行

>head(mtcars,6)

如果要了解有关mtcars数据集的更多信息,请键入以下内容:

?mtcars

mtcars:Motor Trend Car Road Tests

数据来自1974年美国汽车趋势杂志,包括32辆汽车(1973-74款)的油耗和10个方面的汽车设计和性能

查看mtcars数据集的内容:

#1.加载

>data(“mtcars”)

#2.输出

>head(mtcars)

它包含32个观察值和11个变量:

#行数(观察)

>nrow(mtcars)

[1] 32

#列数(变量)

>ncol(mtcars)

[1] 11

iris 数据集以厘米为单位分别测量了3种iris中各50朵花的萼片长度、萼片宽度、花瓣长度和花瓣宽度。该物种是刚毛鸢尾,花斑鸢尾,和弗吉尼亚。

data(“iris”)

head("iris")

牙齿生长数据集包含了研究维生素C对60只豚鼠牙齿生长影响的实验结果。每只动物通过两种给药方法(橙汁或抗坏血酸(一种维生素C,编码为VC)中的一种,接受三种剂量水平的维生素C(0.5、1和2 mg/天)。

>data(“ToothGrowth”)

>head("ToothGrowth")

PlantGrowth

比较在对照和两种不同处理条件下获得的产量(以植物干重测量)的实验结果。

>data("PlantGrowth")

>head(PlantGrowth)

USArrests

这个数据集包含了美国各州暴力犯罪率的统计数据。

>data("USArrests") 

>head(USArrests)

加载内置R数据集:data(“data set_name”)

查看数据集:head(数据集名称)

R语言Excel文件

Microsoft Excel是使用最广泛的电子表格程序,它是以.xls或.xlsx格式存储数据。 R可以使用某些excel特定的包直接读取这些文件的内容。一些常用的软件包有 - XLConnect,xlsx,gdata等。在这个篇文章中,我们将使用xlsx软件包。 R也可以使用这个包写入excel文件。

安装xlsx软件包

可以在R控制台中使用以下命令来安装xlsx软件包。它可能会要求安装一些这个包所依赖的附加包。按照相同的命令与所需的包名来安装附加的包。

install.packages("xlsx")

R

验证并加载“xlsx”软件包

使用以下命令来验证和加载xlsx包。参考以下代码 -

# Verify the package is installed.

any(grepl("xlsx",installed.packages()))

# Load the library into R workspace.

library("xlsx")

R

当脚本运行时,得到以下输出 -

[1] TRUE

Loading required package: rJava

Loading required package: methods

Loading required package: xlsxjars

Shell

注: 如果第一个输出结果为:FALSE,请 install.packages("xlsx") 语句重新加载安装。

准备xlsx文件用作为输入

打开Microsoft excel。将以下数据复制并粘贴到名为sheet1的工作表中。

idname salarystart_datedept

1Rick 623.31/1/2012IT

2Dan 515.2 9/23/2013 Operations

3Michelle 61111/15/2014IT

4Ryan 7295/11/2014HR

5Gary 843.253/27/2015Finance

6Nina 578 5/21/2013IT

7Simon 632.87/30/2013Operations

8Guru 722.56/17/2014Finance

Txt

如下所示 -

如下所示 -

还将以下数据复制并粘贴到另一个工作表,并将此工作表重命名为city。

name city

Rick Seattle

Dan Tampa

Michelle Chicago

Ryan Seattle

Gary Houston

Nina Boston

Simon Mumbai

Guru Dallas

如下所示 -

将Excel文件另存为“input.xlsx”,应该将此文件保存在R工作区的当前工作目录中。

读取Excel文件

使用read.xlsx()函数读取input.xlsx,如下所示,结果作为数据帧存储在R环境中。

# Read the first worksheet in the file input.xlsx.

data <- read.xlsx("input.xlsx", sheetIndex = 1)

print(data)

R

当我们执行上述代码时,会产生以下结果 -

id name salary start_date dept

1 1 Rick 623.30 2012-01-01 IT

2 2 Dan 515.20 2013-09-23 Operations

3 3 Michelle 611.00 2014-11-15 IT

4 4 Ryan 729.00 2014-05-11 HR

5 NA Gary 843.25 2015-03-27Finance

6 6 Nina 578.00 2013-05-21 IT

7 7Simon 632.80 2013-07-30 Operations

8 8 Guru 722.50 2014-06-17Finance

在浏览网页、玩游戏、手机应用等场景,因为网速慢或是硬件差的关系,难免会遇上等待加载的情况,没人喜欢等待,耐心差的用户可能因为操作得不到及时反馈,直接选择放弃。正所谓细节决定成败,这时添加一个Loading进度条动画,就可以大大缓解等待时候的无聊和焦虑,有效让用户明确知道目前Loading的状态,并对结果有一个直观的预期,甚至有趣巧妙的设计,能让用户爱上等待,把等待看成一件很美好的事。 B:Bar Loading动画从某种角度也可以说是进度条,一般用于较长时间的加载,通常配合百分比指数,让用户对当前加载进度和剩余等待时间有个明确的心理预期。最常见的直线进度条。或者圆形进度条。进度条和转场完美融合。也有给LOGO描线的进度条。 R:Rotation 旋转代表时间的流逝,暗示着时钟一样顺时针旋转。不停循环转动的动画,能有效吸引注意力,给用户时间加速的错觉。旋转Loading动画一般用在较短的加载中,要是一直转却始终加载不出来,用户又该烦躁了。最常见的自转。顺时针自转暗示着时间的流逝。巧妙地用两架飞机形成公转。不规则多向转动,让用户把等待的时间用在研究运动规律上。 A:Animation 如果在Loading时配上一个形象的动画,能大大提高产品的亲和力和品牌识别度,用户大多会接受并喜欢这样的形式,一般品牌形象明确的产品会这么做。用可爱的奔跑拟人形象来告诉用户:我在很努力加载请耐心等待。这样萌的章鱼,用户一定舍不得加载界面的结束。 以上就是常见的三种形式,当然创意是无止境的,还有很多Loading动效同时融合了这几种形式,或者用一种全新的形式,比如作者多年前在PSP上见过将小游戏植入到Loading界面中的情况,以至于感叹Loading时间太短都不能好好玩耍了。。