R语言--字符处理(stringr包)

Python016

R语言--字符处理(stringr包),第1张

stringr 包中的大部分函数具有统一风格的命名方式,以 str_ 开头,正则表达式也完全适用该包。

字符串拼接函数 str_c ,与R语言自带的 paste 和 paste0 函数具有相同的作用。

字符计数函数 str_count ,计算字符串中指定字符的个数。

字符检查函数 str_detect ,检查字符串中是否包含指定字符,返回逻辑向量。

字符复制函数 str_dup ,将字符向量重复若干次,返回重复后的字符向量。

字符提取函数 str_extract 和 str_extract_all ,对字符串进行提取, str_extract_all 函数返回所有的匹配结果。

字符串格式化函数 str_glue ,用花括号 {} 表示占位符,括号内的变量被替换成全局变量值。

字符串长度函数 str_length ,计算字符串长度。

字符位置提取函数 str_locate 和 str_locate_all ,返回匹配到的字符的位置。

字符匹配函数 str_match 和 str_match_all 与字符提取函数 str_extract 类似,返回匹配到的字符,不同之处在于返回格式。

字符补齐函数 str_pad ,用于在字符串中添加单个字符,可选择添加的位置,在参数 side 中进行设置。

字符删除函数 str_remove 和 str_remove_all ,用于删除字符串中的部分字符。

字符替换函数 str_replace 、 str_replace_all 和 str_replace_na ,用于替换字符串中的部分字符。

字符排序函数 str_sort 和 str_order ,对字符向量进行排序。

字符分割函数 str_split 和 str_split_fixed ,对字符串进行分割。

字符过滤函数 str_sub 和 str_subset , str_sub 函数通过指定开始和结束位置,过滤出字符串的部分字符串。 str_subset 函数通过匹配模式,过滤出满足模式的字符串。

stringr 包中其他的有用函数,用于常见的字符处理。

paste (..., sep = " ", collapse = NULL)

paste0(..., collapse = NULL)

两个参数: sep 字符串内的拼接符; collapse 字符串间的拼接符。 paste 与 paste0 的区别: paste0 参数 sep 默认为空字符, paste 的参数 sep 默认为空格。

str_c(..., sep = "", collapse = NULL)

参数:与paste一致,但对NA的处理方法不一致。

1、mode()会输出一个R对象的基本数据类型(模式)

R可以处理的数据类型(types)(也叫模式(modes))包括数值型、字符型、布尔型、复数型(虚数)和原生型(字节)。

2、str()函数会输出一个R对象的结构

基本的数据结构(向量、矩阵、数组、数据框、因子、列表)

3、class()查看某对象的类型

class:是一种抽象类型,或者理解为一种数据结构(数据框,因子,列表)

他主要是用来给泛型函数(参考java中泛型的概念)识别参数用。

patientID <- c(1, 2, 3, 4)

age <- c(25, 34, 28, 52)

diabetes <- c("Type1","Type2","Type1","Type1")

status <- c("Poor","Improved","Excellent","Poor")

patientdata <- data.frame(patientID, age, diabetes,status)