R语言中，unique和duplicate的区别是什么

2023-02-22 02:11:02Python010

R语言中，unique和duplicate的区别是什么,第1张

unique返回对象的不同取值，如“unique(c(1,1,2,3)) ”返回1 2 3

duplicated 判断对象的每个取值是否重复，如“duplicated(c(1,1,2,3)) ”返回 FALSE TRUE FALSE FALSE ，其中T对应的为重复的值。

【R语言】

R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。

链接网页链接

【R语言的特点】

R作为一种统计分析软件，是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上，而且嵌入了一个非常方便实用的帮助系统，相比于其他统计分析软件，R还有以下特点：

1、R是自由软件。这意味着它是完全免费,开放源代码的。可以在它的网站及其镜像中下载任何有关的安装程序、源代码、程序包及其源代码、文档资料。标准的安装文件身自身就带有许多模块和内嵌统计函数,安装好后可以直接实现许多常用的统计功能。

2、R是一种可编程的语言。作为一个开放的统计编程环境,语法通俗易懂,很容易学会和掌握语言的语法。而且学会之后,我们可以编制自己的函数来扩展现有的语言。这也就是为什么它的更新速度比一般统计软件,如,SPSS,SAS等快得多。大多数最新的统计方法和技术都可以在R中直接得到。

3、所有R的函数和数据集是保存在程序包里面的。只有当一个包被载入时,它的内容才可以被访问。一些常用、基本的程序包已经被收入了标准安装文件中,随着新的统计分析方法的出现,标准安装文件中所包含的程序包也随着版本的更新而不断变化。在另外版安装文件中,已经包含的程序包有：base一R的基础模块、mle一极大似然估计模块、ts一时间序列分析模块、mva一多元统计分析模块、survival一生存分析模块等等.

用法：assign(x, value, pos = -1, envir = as.environment(pos), inherits = FALSE, immediate = TRUE)

assign函数在循环时候，给变量赋值。

举例说明：

1、

for (i in 1:(length(rowSeq)-1)){

assign(paste("nginx_server_fields7_", i, sep = ""), nginx_server_fields7[(rowSeq[(i-1)+1]):(rowSeq[i+1]), ])

}

2、

for (i in 1:3){

assign(paste("a", i, sep = ""), i:10)

}

ls()

[1] "a1" "a2" "a3" "i"

>a1

[1] 1 2 3 4 5 6 7 8 9 10

>a2

[1] 2 3 4 5 6 7 8 9 10

>a3

[1] 3 4 5 6 7 8 9 10

1、paste函数可用于字符串连接

用法：paste (..., sep = " ", collapse = NULL)，分隔符默认为空格

我们简单举个例子

1）paste("a","b") ##能连接a b

[1] "a b"

paste("a","b","c")

[1] "a b c"

2）设置分隔符paste("a","b",sep="=") ##注意到用等号分隔了

[1] "a=b"

3）连接多个元素paste("a",1:5,sep="") ##会自动每个元素与a相连

[1] "a1""a2""a3""a4""a5"

4）paste("a",1:5,".pdf",sep="") ##比如想批量输出文件名

[1] "a1.pdf""a2.pdf""a3.pdf""a4.pdf""a5.pdf"、

2、collapse参数

谢益辉大佬说这个参数引无数英雄竞折腰啊，大家只会sep

1）paste("a",1,collapse="+") ##注意到了吧，collapse没用上

[1] "a 1"

2）paste(c("a","b","c"),collapse="+") ##这样就很容易理解了，collapse折叠起了元素

[1] "a+b+c"

3）paste("a",1:5,sep="") ##再来更明显的举例

[1] "a1""a2""a3""a4""a5"

4）paste("a",1:5,sep="",collapse="+") ##先在元素间连接，然后折叠

[1] "a1+a2+a3+a4+a5"

3、与paste0函数的区别

paste0函数，默认sep=""是两个函数唯一的区别

paste(c("a","b","c"),1:3)##默认空格符

[1] "a 1""b 2""c 3"

paste(c("a","b","c"),1:3,sep=" ")

[1] "a 1""b 2""c 3"

paste(c("a","b","c"),1:3,sep="")

[1] "a1""b2""c3"

如果两个向量长度不同paste(c("a","b","c"),1:5) ##超出范围后继续从前向后连接

[1] "a 1" "b 2" "c 3" "a 4" "b 5"

paste0(c("a","b","c"),1:3)#默认元素连接为sep=""

[1] "a1""b2""c3"

用法：unlist()函数的作用，就是将list结构的数据du，变zhi成非list的数据，即将list数据变成字符串向量或者数字向量的形式

如果是向量的话就直接输出向量

例子：

%in%相当于match()函数的一个缩写。用来判断一个数组或矩阵是否包含在另一个数组或矩阵里。举个例子一目了然：

#首先复制两个变量a和b

>a <- 1:5

>b <- 3:7

>a %in% b #看a的元素是否包含在b中输出结果如下：

[1] FALSE FALSE TRUE TRUE TRUE

用法：apply(x, MARGIN, FUN, ...)

作用：对矩阵的行或列使用函数，或者对数组的各个维度使用函数

x为数据对象，MARGIN是维度的下标，MARGIN=1表示行，MARGIN=2表示列，FUN是自己指定的任意或自定义函数

注：数据框dataframe也可以使用apply函数，该函数会自动将数据框转化为矩阵，但前提是数据框中各列的数据类型必须是数值型，否则会报错。

用法：lapply(x,FUN,...)

作用：对列表中的各个元素使用函数

x是格式为列表的数据源，FUN是任意函数。

intersect(data1，data2)：交集

union(data1，data2)：并集

1.“插入公式”功能在“插入”选项卡下的“符号”菜单中。如图点击“公式”按钮。

2.如果点击了下拉菜单，则选择“插入新公式”选项。

3.可以看到，当点击了“公式”后，进入到了公式编辑的状态。（使用“Alt+=”快捷键可直接进入此界面）

4.首先插入简介图片中的第一个向量。在公式编辑状态下，选择如图“导数符号”里的“右箭头在上”。

5.然后点击如图的黑色虚线方框（以下简称方框），使方框处于选中状态。

6.输入“OA”。然后选中整个向量，在“开始”菜单下的“字体”菜单里设置“斜体”。

7.接下来插入简介图片中的第二个向量。同样在公式编辑状态下，选择“导数符号”里的“右箭头在上”。点击方框，使方框处于选中状态。（同步骤4，步骤5）输入“OA”，并使光标定位在如图位置。（这个位置没有选中所输入的OA）

8.然后需要插入垂直符号，在“插入”菜单下点击“符号”，如图点击“其他符号”。

9.在弹出的“符号”对话框里将“子集”选择为“数学运算符”，就可以看到需要输入的垂直符号，选中点击“插入”。（平行符号也在这里插入）

10.然后再回到“设计”菜单，选择“导数符号”里的“右箭头在上”，选中黑色方框输入“OB”。

11.最后还是选中所输入的内容，设置为斜体就可以了。

函数向量符号方框统计分析

# 上一篇：css颜色值设置方式有哪些

# 下一篇：C语言怎么输出mp3的二进制编码

推荐阅读

热门文章

最新发布

标签列表

R语言中，unique和duplicate的区别是什么

给您推荐相同类型的内容：