20190506-R语言字符处理函数substr、substring、sub、gsub

Python014

20190506-R语言字符处理函数substr、substring、sub、gsub,第1张

Usage

substr(x, start, stop)

提取或替换特定位置的字符,类比chartr

Example

Usage

substring(text, first, last = 1000000L)

提取或替换特定位置的字符,类比chartr,默认last为很大的数

Example

Usage

sub(pattern, replacement, x, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

向量x中寻找特定字符(pattern),将其替换为replacement,只替换第一次匹配的字符串

Arguments

Usage

gsub(pattern, replacement, x, ignore.case = FALSE, perl = FALSE,

fixed = FALSE, useBytes = FALSE)

在向量x中寻找特定字符(pattern),将其替换为replacement,gsub()是对向量里面的每个元素进行搜素,如果发现元素里面有多个位置匹配了模式,则全部进行替换

Example

sub只替换第一次匹配的字符串,gsub会替换掉所有匹配的字符串

Example

1.length(字符串/向量):返回向量中元素的个数

2.nchar(字符串/向量):返回每个元素字符串的个数

下面这个截图可以形象的说明两者之间的区别:

3.paste(向量/字符串):用于粘贴字符串,将多个字符串合并成一个:

5.paste函数连接向量和字符串,根据R语言向量化处理的逻辑,并不是将字符串添加到向量的尾部,而是向量中的 每个 元素分别与字符串相连。

1. substr函数 用于提取字符串,很有用的函数,函数的参数分别是一个原始的字符串,一个起始点和一个结束点,函数返回起始点和结束点之间的字符串

sub函数 只进行一次替换, gsub函数 进行全局替换

2. gsub函数 :向量中的每个字符的第一个字母都变成大写,括号里面写成正则表达式替换的形式,其中倒三角 ^ 表示首字母, \w 表示字符集的简写,代表所有小写字符, \U 表示转化为大写, \L 表示转化为小写,后面的 1 表示只转换一次。后面接perl逻辑值

1. grep函数 用于在字符串中搜索某种模式,fixed函数是是否进行正则表达式,如果 fixed=FALSE ,则支持正则表达式;如果 fixed=TURE ,则搜索模式为一个文本字符串,返回值为匹配的下标。

结果:

1. strsplit函数 用于字符串分割,根据固定规则将一个长的字符串分割为多份,在字符串处理中,分割字符串也是关键的步骤之一,函数返回列表而非向量。这是因为第一个参数的字符串可以是一个向量,向量中可以包含多个子串,返回时是列表也方便处理。

有两个字符串,我们需要生成他们的所有组合,这也叫做笛卡尔积,在实际问题中也很常用,这需要使用到 outer函数

plot(x, y = NULL, type = "p", xlim = NULL, ylim = NULL, log = "", main = NULL, sub = NULL, xlab = NULL, ylab = NULL, ann = par("ann"), axes = TRUE, frame.plot = axes, panel.first = NULL, panel.last = NULL, asp = NA, xgap.axis = NA, ygap.axis = NA,   ...)

x,y  用于横纵坐标作图的数据对象。

type 图类型(线条和点类型),使用格式type=" "。

                                                   type="p"显示为空心点。plot

                                                   type="l"显示为线条。line

                                                   type="b"显示为空心点和线条。both

                                                   type="c"显示为无点和线条。

                                                   type="o"显示为空心点和线条,线穿过空心点。

                                                   type="s"/"S"显示为阶梯线。

                                                   type="h"显示为直方图样的垂直线。

                                                   type="n"显示为无点和无线条。

xlim/ylim 用于指定图的x轴和y轴的范围,使用格式:xlim=c(x1,x2), ylim=c(y1,y2)。

xlab/ylab 用于给图的x轴和y轴添加标签,使用格式:xlab="xlab",ylab="ylab"。

main 用于对plot添加主标题, main="   "。

sub   用于对plot添加副标题, sub="   "。

log   用于对x或者y值取log。log="x"/"y"/"xy"。

ann  使用T/F对plot中的标题,x轴标签,y轴标签是否显示进行定义。

axes  使用T/F对坐标轴是否显示进行定义。

frame.plot  使用T/F对画图外框是否显示进行定义。

panel.first  参数还没弄懂,panel.first="grid(8,8)"对背景线进行定义。

asp  表示y/x的纵横比。

lty   用于线条类型的定义,指定值为整数,lty="1"。

                                                   lty="0"显示为空白,即无线条。

                                                   lty="1"显示为实线线条。

                                                   lty="2"显示为虚线线条。

                                                   lty="3"显示为点状线条。

                                                   lty="4"显示为点虚线线条,点和虚线线条间隔。

                                                   lty="5"显示为长虚线。

                                                   lty="1"显示为双破折号线条。