R语言面向对象

Python031

R语言面向对象,第1张

对事物越了解,就能够越好的驾驭这种事物。

R语言有四种面向对象的系统,一般而言,使用其中最简单的一种就已经足够了。

本文介绍S3,和S4的使用

S3是R中第一个,也是最简单的oo系统,S3不是非常正式,但是其保有一种极简主义的优雅.

在R语言当中,遇到的大多是情况是S3对象,但是R基础包中没有一个方法检验对象是不是S3对象,但是有一个简单的方法检验是不是S3对象 is.object(x)&!isS4(x)

另外一个方法是 pryr::otype()

在S3中,方法称之为泛型函数,S3的方法不属于对象和类。

S3是一个很简单的系统;他没有正式的类定义。为给一个类创建一个对象实例,只需要使用已经有的基础对象并且为对象设置类属性。

使用 structure 创建类对象,或者最后使用 class<–()

大多数S3提供了一个构造函数

构造函数的名字应该和类的名字相同。

为了添加一个新的泛型函数,创建一个调用 UseMethod 的函数。其有两个参数:泛型函数的名字和方法派送的参数:

首先我有一个函数 f

然后就可以写一个类的方法: (generic.class) , f 是函数名, B 是我定义的一个类

注意,这里用到了 f.B .所以在创建函数的时候不建议使用 . 。

在S3中,可以使用类属性设置将任意的对象转变成为一个特定的类对象。

S4则是更严格:必须使用 setClass 来定义类,使用 new() 来创建一个新对象.

S4有一个注意点

下面创建类,并进行继承

setGeneric 可以创建一个新的泛型函数或者将已经有的函数转换成为泛型函数。

setMethod 的参数包括:泛型函数的名字,与该方法关联起来的类,执行方法的函数。例如,将只能用于向量上的 union 应用与数据框上

实际工作中,数据集很少是完整的,许多情况下样本中都会包括若干缺失值NA,这在进行数据分析和挖掘时比较麻烦。R语言通过na.fail和na.omit函数可以很好地处理样本中的缺失值。这两个函数的说明如表2-4所示。

表2-4 na.fail和na.omit函数说明

函数 说明

na.fail na.fail(<向量a>) 如果向量a内包括至少1个NA,则返回错误;

如果不包括任何NA,则返回原有向量a

na.omit na.omit(<向量a>) 返回删除NA后的向量a

attr( na.omit(<向量a>) ,"na.action") 返回向量a中元素为NA的下标

下面来看如下相关示例:

data<-c(1,2,NA,2,4,2,10,NA,9)

data.na.omit<-na.omit(data)

data.na.omit

[1] 1 2 2 4 2 10 9

attr(,"na.action")

[1] 3 8

attr(,"class")

[1] "omit"

attr(data.na.omit,"na.action")

[1] 3 8

attr(,"class")

[1] "omit"

其中,函数na.fail和 na.omit 不仅可以应用于向量,也可以应用于矩阵和数据框。另外还可以使用!x方式方便地删除NA。例如:

a<-c(1,2,3,NA,NA,2,NA,5)

a[!is.na(a)]

[1] 1 2 3 2 5

其中,is.na用于判断向量内的元素是否为NA,返回结果应该是:

向量FALSE FALSE FALSE TRUE TRUE FALSE TRUE FALSE

即a内元素为NA,其对应的下标元素是TRUE,反之是FALSE。!x是取非逻辑运算符,!is.na(a)表示a内元素不为NA,其对应的下标元素是TRUE,反之是FALSE。通过a[!is.na(a)]进行索引后,即可取出a内不为NA的元素,将其过滤。