R语言怎么判断一个变量是否包含另一个变量的元素？

2023-02-23 03:46:02Python012

R语言怎么判断一个变量是否包含另一个变量的元素？,第1张

1.变量变换

as.array(x),as.data.frame(x),as.numeric(x),as.logical(x),as.complex(x),as.character(x),...转换变量类型；使用如下命令可得到全部列表，methods(as)

factor()：将一个向量转化为一个因子

2.变量信息

is.na(x),is.null(x),is.array(x),is.data.frame(x),is.numeric(x),is.complex(x),is.character (x),...检验变量的类型；使用如下命令得到全部列表，methods(is)

length(x):x中元素的个数

dim(x):查看变量的维数；重新设置的维数，例如dim(x)=c(3,2)

dimnames(x):重新设置对象的名称

nrow(x):行的个数

ncol(x):列的个数

class(x):得到或设置x的类；class(x)<-c(3,2)

unclass(x):删除x的类

attr(x,which):得到或设置x的属性which

attributes(obj):得到或设置obj的属性列表

fix,edit:对数据框数据进行表格形式的编辑

3.数据选取和操作

which.max(x):返回x中最大元素的指标

which.min(x):返回x中最小元素的指标

rev(x):翻转x中所有的元素

sort(x):升序排列x中的元素；降序排列使用：rev(sort(x))

cut(x,breaks):将x分割成为几段（或因子）；breaks为段数或分割点向量

match(x,y):返回一个和x长度相同且和y中元素相等的向量不等则返回NA

which(x==a):如果比较操作为真（TRUE）,返回向量x的指针

choose(n,k):组合数的计算

na.omit(x):去除缺失值(NA)（去除相关行如果x为矩阵或数据框）

na.fail(x):返回错误信息，如果x包含至少一个NA

unique(x):如果x为向量或数据框，返回唯一值

这是最后一篇讲解有关矩阵操作的博客，介绍有关矩阵的函数，主要有 rowSums() , colSums() , rowMeans() , colMeans() , apply() , rbind() , cbind() , row() , col() , rowsum() , aggregate() , sweep() , max.col() 。

下面通过例子来了解这些函数的用法：

我们知道，通过下标索引 [i, j] 可以访问矩阵的某一部分，索引如果没有提供意味着“所有行”或“所有列”。来看个例子，比如：

在R中，可以用一些特殊的函数来进行矩阵的行、列计算。来看些例子：

上述矩阵的行、列计算，还可以使用 apply() 函数来实现。 apply() 函数的原型为 apply(X, MARGIN, FUN, ...) ，其中： X 为矩阵或数组； MARGIN 用来指定是对行运算还是对列运算， MARGIN＝1 表示对行运算， MARGIN＝2 表示对列运算； FUN 用来指定运算函数； ... 用来指定 FUN 中需要的其它参数。来看些例子：

用 apply() 函数来实现上面的例子

apply() 函数功能很强大，我们可以对矩阵的行或列进行其它运算，例如：

如果矩阵存在 NA 值，可通过设置 na.rm=TRUE 来忽略 NA 值，然后再计算。比如：

甚至我们还可以自定义运算函数，来看个例子：

在R中， rbind() 和 cbind() 函数可分别为矩阵添加行和列，来看一个例子：

在R中， row() 和 col() 函数将分别返回元素的行和列下标矩阵，来看个例子：

通过这两个函数，可以获取矩阵的对角元素以及上下三角矩阵，例如：

有时，你可能需要对每行进行分组，然后组内每列求和。在R中可以用 rowsum() 函数来解决，而且效率也非常高。先看个例子：

你也可以用 aggregate() 函数获得类似结果：

有人就会问“为啥没有列分组求和的操作？”，其实你可以先将矩阵转置，然后行分组求和；这两步就等同于列分组求和。

sweep() 函数的原型为 sweep(x, MARGIN, STATS, FUN = "-", check.margin = TRUE, ...) ，其中： x 为矩阵或数组； MARGIN 用来指定是对行运算还是对列运算， MARGIN＝1 表示对行运算， MARGIN＝2 表示对列运算； STATS 表示想要清除的统计量； FUN 用来指定运算函数，默认为减法 - ； check.margin 用来核实 x 的维度是否与 STATS 的匹配，如果事先知道它们匹配的话，将其设为 FALSE 将提高运算速度； ... 用来指定 FUN 中需要的其它参数。来看些例子：

事实上，通过改变 FUN 参数的具体形式或自定义函数， sweep() 函数可以实现很多不同操作，这里就不细讲了。

max.col() 函数返回矩阵每行最大值所在的列位置（即列下标），其原型为 max.col(m, ties.method = c("random", "first", "last")) ，其中： m 为矩阵；当存在多个最大值时， ties.method 指定用哪种方式来处理这种情况，默认为"random"（随机），"first"指使用第一个最大值，"last"指使用最后一个最大值。来看个官网例子：

我们也可以结合 apply() 和 which.max() 函数来实现 max.col(mm, 'first') 。看个例子，

R矩阵的最后一部分内容就讲到这。

如若有遗漏，后期将会添加至本博客。

sum(向量名）：求和

max(向量名）：返回向量最大值

min(向量名）：返回向量最小值

range(向量名）：返回向量中的上界和下界

mean(向量名）：返回向量平均值

var(向量名）：返回向量的方差

sd(向量名）：返回向量的标准差

prod(向量名）：向量中所有值的乘积

median(向量名）：求中位数