length与nchar不同,length是取向量的长度
字符替换
字符串粘合函数
paste在不指定分割符的情况下,默认分割符是空格
paste0在不指定分割符的情况下,默认分割符是空
字符串截取函数
字符串替换
gsub替换匹配到的全部
sub 替换匹配到的第一个
字符串匹配
grep函数返回的是索引值
grepl函数返回的是逻辑值
match:匹配两个向量,返回x中存在的返回索引或TRUE、FALSE
match函数使用格式有如下两种:
参数详解
第一种方便设置参数,返回x中元素在table中的位置
第二种简洁,返回x中每个元素在table中是否存在
pmatch函数是一个部分匹配函数, 依次从x里面挑出元素, 对照table进行匹配, 若匹配上则剔除匹配上的值, 不再参与下次匹配, duplicate.ok可设置是否剔除对于某一个元素, 匹配一共分成三步:
如果可以完全匹配, 则认为匹配上了, 返回table中的位置
不满足上述条件, 如果是唯一部分匹配, 则返回table中的位置
不满足上述条件, 则认为没有值与其匹配上.
pmatch函数的格式
pmatch(x, table, nomatch = NA_integer_, duplicates.ok = FALSE)
grep()能对向量中特定条件的元素进行查询,默认return为index。grep()语法与grep()大致相似,但默认return为logical。
默认情况下是匹配尽可能多的字符,是为贪婪匹配,比如sub("a. b","",c("aabab","eabbe")),默认匹配最长的a开头b结尾的字串,也就是整个字符串。如果要进行懒惰匹配,也就是匹配最短的字串,只需要在后面加个“?”,比如sub("a. ?b","",c("aabab","eabbe")),就会匹配最开始找到的最短的a开头b结尾的字串。