R语言 --- split 二三事

Python010

R语言 --- split 二三事,第1张

最近有很多对文件的操作,经常使用到split函数,但是存在三个split函数,有时候会弄混,谨以此文以记之。

1. split()

2. str_spit()

3. strsplit()

总结: split(参数):split(向量/列表/数据框,因子/因子列表)

split()函数可以分组数据框和向量,返回list。

可以直接使用unsplit()。

split是按照factor去切分vector或者数据框,因此不能这样用:

切割数据框的用法:

针对vector的用法:

str_spllit()主要用于 split a vector of strings. 返回一个list。

str_spllit_fixed()可以返回一个matrix。

举个栗子:

上栗子:

R语言字符串处理常用函数

R语言中常用的字符串处理函数:

(1)得到字符串长度:nchar()

# 生成示范字符串

(2)剪切字符串:strsplit()

# 对字符串进行剪切

(3) 得到子字符串:substr()

# 得到子字符串

(4) 判断字符串中是否有某个字串:grepl()

# 判断字符串中是否有某个字串

(5) 字符串替换:gsub()

(6)字符串定位

在Hmisc包里,有一个函数可以很方便的对文本的的目标字符串进行定位,substring.location()