最近有很多对文件的操作,经常使用到split函数,但是存在三个split函数,有时候会弄混,谨以此文以记之。
1. split()
2. str_spit()
3. strsplit()
总结: split(参数):split(向量/列表/数据框,因子/因子列表)
split()函数可以分组数据框和向量,返回list。
可以直接使用unsplit()。
split是按照factor去切分vector或者数据框,因此不能这样用:
切割数据框的用法:
针对vector的用法:
str_spllit()主要用于 split a vector of strings. 返回一个list。
str_spllit_fixed()可以返回一个matrix。
举个栗子:
上栗子:
由以上可知, paste() 默认连接符为空格, paste0() 连接符为空,等于 paste(sep = '')
由以上可知,当被组合对象元素个数不相等时,会依次选取元素组合,最终的组合数等于元素个数多的那个
针对变量内部元素进行拼接时,使用 x[1:n] 进行遍历,'n'小于 x 的维度
str_split_fixed(str,pattern,n) , pattern 为分隔符,如果 pattern = '' ,则将 str 拆分成一个个字符,n表示将 str 拆分n个部分,若 n 小于 str 中分隔符个数,则只有前 n-1 个(3刀4段)分隔符发挥作用,后面的分隔符不起作用