R语言之字符串的组合与拆分

2023-02-24 22:11:01Python015

R语言之字符串的组合与拆分,第1张

由以上可知， paste() 默认连接符为空格， paste0() 连接符为空，等于 paste(sep = '')

由以上可知，当被组合对象元素个数不相等时，会依次选取元素组合，最终的组合数等于元素个数多的那个

针对变量内部元素进行拼接时，使用 x[1:n] 进行遍历，'n'小于 x 的维度

str_split_fixed(str,pattern,n) ， pattern 为分隔符，如果 pattern = '' ，则将 str 拆分成一个个字符，n表示将 str 拆分n个部分，若 n 小于 str 中分隔符个数，则只有前 n-1 个（3刀4段）分隔符发挥作用，后面的分隔符不起作用

R语言的merge函数可以实现类似SQL的有点类似 left join right join 或者类似union的效果。

执行merge函数时，函数自动会找到两个数据框df1和df2共有的列，即id那一列（即相当于by= "id"），当参数all= FALSE时，会将两个数据框中该列数值相等的那些行输出来，类似于对这两个数据框的id这一列求交集（intersection)。此例中是id为2或7这两行。此外，还可以发现df1和df2的输入顺序不会影响最终结果，仅仅会影响输出结果中heights和weights这两列的顺序。

更详细可以参考 http://rstudio-pubs-static.s3.amazonaws.com/13602_96265a9b3bac4cb1b214340770aa18a1.html

by参数的使用

上面的示例中by参数只有一个值，如果有两个数值（即长度为2的向量），也就是两个数据框中有共同的两列。

为两个数据框分别添加一列后，这样它们就有了共同的两列。当运行merge函数后发现，函数会自动找到共同的列，然后找到id和sex这两列中共有的数值。此外，如果只设定by= "id"的话，则两数据框中共有的sex那一列则会以sex.x和sex.y形式输出。

R语言是用于统计分析、绘图的语言和操作环境。R语言是属于GNU系统的一个自由、免费、源代码开放的软件，它是一个用于统计计算和统计制图的优秀工具。R是一套完整的数据处理、计算和制图软件系统。其功能包括：数据存储和处理系统；数组运算工具（其向量、矩阵运算方面功能尤其强大）；完整连贯的统计分析工具；优秀的统计制图功能；简便而强大的编程语言：可操纵数据的输入和输出，可实现分支、循环，用户可自定义功能。

R语言按照以下几点进行数据分类

通过选择菜单

程序包->安装程序包->在弹出的对话框中，选择你要安装的包，然后确定。

使用命令

install.packages("package_name","dir")package_name:是指定要安装的包名，请注意大小写。dir:包安装的路径。默认情况下是安装在..\library 文件夹中的。可以通过本参数来进行修改，来选择安装的文件夹。

本地来安装

如果你已经下载的相应的包的压缩文件，则可以在本地来进行安装。请注意在windows、unix、macOS操作系统下安装文件的后缀名是不一样的：

1）linux环境编译运行：tar.gz文件

2）windows 环境编译运行：.zip文件

3）MacOSg环境编译运行:.tgz文件

加载包

包安装后，如果要使用包的功能。必须先把包加载到内存中（默认情况下，R启动后默认加载基本包），加载包命令：