js正则匹配总结

JavaScript04

js正则匹配总结,第1张

js匹配是js中比较重要的一个概念,我们在工作中经常用到,但是往往都是记得不是很清楚,或者有些遗忘,这次记录总结一下,让自己加深一下印象,同时也会小伙伴们提供查阅资料的地方

正则匹配模式分为两种,一种是贪婪模式,另一种是非贪婪模式

贪婪模式:在遇到歧义时候尽可能的多的匹配符合的结果

非贪婪匹配:在遇到歧义时候匹配到一次符合的结果就不匹配了

js默认是贪婪匹配模式,贪婪模式变成非贪婪模式只需要在贪婪量词({n, }, {n, m}, + , ?, *)后面加一个?就行了

附加: 正则匹配中?的几种用法

正则匹配的前瞻就是给正则匹配的选项定义一个断言,或者说是一个条件比如:我要匹配一个字母,但是我的需求是字母后面必须是跟着一个数字的情况,那么这种场景是怎么实现了,就是用到前瞻的概念,那么我想要他的前面也要是一个数字怎么办了,这就是后顾。

前瞻后顾的描述

正则匹配新特性

以上的三个匹配形式都是不被捕获的,其中前两个是不匹配的,他只是用来当作条件来用,第三个是要被匹配的

1:任何元字符在没有写量词的情况下,只匹配一次

2:写了量词,默认是贪婪匹配

3:正则匹配一旦全部找到就不会在继续去匹配,除非你设置了全局g

4:正则匹配按照匹配规如果中间中断没有匹配到,并且字符串没有匹配完,会继续按照匹配规则重新匹配

5:(pattern)如果匹配到了很多结果,只捕获最后一次匹配到的结果

6:任何量词都只作用于前面的元字符

1:source 2:global 3:ingoreCase 4:multiline 5:lastIndex

字符串满足正则匹配规则就会返回true,但是如果正则匹配里面含有全局的话,那么多运行几遍会报错,因为正则每次匹配开始都是看lastIndex的,全局情况下lastIndex每次执行都会被改变

如果没有找到任何匹配就返回null,如果找到了则返回一个数组,exec方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)

第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)

...

以此类推。

其中还有三个参数

index:表示匹配到的文本的第一个字符所在的索引位置

input: 表示被匹配的文本

groups:表示有名的分组

在全局下也是一样因为exec永远只返回第一个匹配。

如果没有找到任何匹配就返回null,如果找到了则返回一个数组,match方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)

第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)

...

以此类推。

其中还有三个参数

index:表示匹配到的文本的第一个字符所在的索引位置

input: 表示被匹配的文本

groups:表示有名的分组

在非全局的情况下,这个方法和exec一模一样,但是在全局的情况下,差别很大,在全局的情况下,只会返回匹配到的结果,并且lastIndex始终为0, 如果没匹配到就返回null

该方法用来替换字符串,第一个参数是正则表达式,第二个参数可以是字符串也可以是函数

正则匹配测试工具

(1)字符串就是零个或多个排在一起的字符。

(2)放在单引号或双引号之中。 'abc' "abc"。

(3)单引号字符串的内部,可以使用双引号。

(4)双引号字符串的内部,可以使用单引号。

(5)反引号`` :反引号允许跨行。

反引号允许字符串跨越多行并可以使用

${…} 在字符串中嵌入表达式。

(1)charAt 方法返回指定位置的字符,参数是从0开始编号的位置。

找一个字符串中的某个位置是那个字符串。

charCodeAt:返回字符串指定位置的 Unicode 码点(十进制表示)

(2)[]

字符串可以被视为字符串数组,因此可以用数组的方括号运算符,用来返回某个位置的字符

但是字符串只是数组的相似性而已实际上、没办法改变字符串中的某个字符

length 只是返回了字符串的长度,该属性没办法改变

字符串使用Unicode字符集,js内部所有的都是Unicode表示的。

JavaScript中的字符串使用的是 UTF-16 编码。

toLowerCase() 和 toUpperCase()方法可以改变大小写。

String对象是js原生提供的三个包装对象之一。用来生成字符串对象。

(1)构造函数

字符串对象是一个类数组对象,很像数组,但不是真正的数组。

(2)将任意的值转成字符

用于连接两个字符串,返回一个新字符串,不改变原字符串。

从原字符串取出子字符串并返回,不改变原字符串。

它的第一个参数是子字符串的开始位置,

第二个参数是子字符串的结束位置(不含该位置)。

如果省略第二个参数,则表示子字符串一直到原字符串结束。

用于从原字符串取出子字符串并返回,不改变原字符串,跟slice方法很相像。

它的第一个参数表示子字符串的开始位置,

第二个位置表示结束位置(返回结果不含该位置)

如果省略第二个参数,则表示子字符串一直到原字符串结束。

区别:slice 和 substring的区别?

slice:

如果参数是负值,表示从结尾开始倒数计算的位置,即该负值加上字符串长度。

如果第一个参数大于第二个参数(正数情况下),slice()方法返回一个空字符串。

substring:

如果第一个参数大于第二个参数,substring方法会自动更换两个参数的位置。

如果参数是负数,substring方法会自动将负数转为0。

由于这些规则违反直觉,因此不建议使用substring方法,应该优先使用slice。

总结:获取子字符串,使用 slice 或 substring。

用于确定一个字符串在另一个字符串中第一次出现的位置,

返回结果是匹配开始的位置。如果返回-1,就表示不匹配。

indexOf方法还可以接受第二个参数,表示从该位置开始向后匹配。

lastIndexOf

lastIndexOf方法的用法跟indexOf方法一致,主要的区别是lastIndexOf从尾部开始匹配,indexOf则是从头部开始匹配。

总结:查找子字符串时,使用 indexOf 或 includes/startsWith/endsWith 进行简单检查。

endsWith 用来判断当前字符串是否是以另外一个给定的子字符串“结尾”的,根据判断结果返回 true 或 false。

用于去除字符串两端的空格,返回一个新字符串,不改变原字符串。

toLowerCase方法用于将一个字符串全部转为小写,

toUpperCase则是全部转为大写。

它们都返回一个新字符串,不改变原字符串

split方法按照给定规则分割字符串,返回一个由分割出来的子字符串组成的数组。

如果分割规则为空字符串,则返回数组的成员是原字符串的每一个字符。

如果省略参数,则返回数组的唯一成员就是原字符串。

split方法还可以接受第二个参数,限定返回数组的最大成员数。

返回一个新字符串,表示将原字符串重复n次。

字符串补全长度的功能。如果某个字符串不够指定长度,

会在头部或尾部补全。padStart()用于头部补全,padEnd()用于尾部补全。

trimStart()消除字符串头部的空格,

trimEnd()消除尾部的空格。

返回一个由替换值(replacement)替换部分或

所有的模式(pattern)匹配项后的新字符串。

模式可以是一个字符串或者一个正则表达式,

替换值可以是一个字符串或者一个每次匹配都要调用的回调函数。

如果pattern是字符串,则仅替换第一个匹配项.

web前端笔记4-有讲 如果感兴趣、请参考之前文章