js正则匹配总结

JavaScript08

js正则匹配总结,第1张

js匹配是js中比较重要的一个概念,我们在工作中经常用到,但是往往都是记得不是很清楚,或者有些遗忘,这次记录总结一下,让自己加深一下印象,同时也会小伙伴们提供查阅资料的地方

正则匹配模式分为两种,一种是贪婪模式,另一种是非贪婪模式

贪婪模式:在遇到歧义时候尽可能的多的匹配符合的结果

非贪婪匹配:在遇到歧义时候匹配到一次符合的结果就不匹配了

js默认是贪婪匹配模式,贪婪模式变成非贪婪模式只需要在贪婪量词({n, }, {n, m}, + , ?, *)后面加一个?就行了

附加: 正则匹配中?的几种用法

正则匹配的前瞻就是给正则匹配的选项定义一个断言,或者说是一个条件比如:我要匹配一个字母,但是我的需求是字母后面必须是跟着一个数字的情况,那么这种场景是怎么实现了,就是用到前瞻的概念,那么我想要他的前面也要是一个数字怎么办了,这就是后顾。

前瞻后顾的描述

正则匹配新特性

以上的三个匹配形式都是不被捕获的,其中前两个是不匹配的,他只是用来当作条件来用,第三个是要被匹配的

1:任何元字符在没有写量词的情况下,只匹配一次

2:写了量词,默认是贪婪匹配

3:正则匹配一旦全部找到就不会在继续去匹配,除非你设置了全局g

4:正则匹配按照匹配规如果中间中断没有匹配到,并且字符串没有匹配完,会继续按照匹配规则重新匹配

5:(pattern)如果匹配到了很多结果,只捕获最后一次匹配到的结果

6:任何量词都只作用于前面的元字符

1:source 2:global 3:ingoreCase 4:multiline 5:lastIndex

字符串满足正则匹配规则就会返回true,但是如果正则匹配里面含有全局的话,那么多运行几遍会报错,因为正则每次匹配开始都是看lastIndex的,全局情况下lastIndex每次执行都会被改变

如果没有找到任何匹配就返回null,如果找到了则返回一个数组,exec方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)

第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)

...

以此类推。

其中还有三个参数

index:表示匹配到的文本的第一个字符所在的索引位置

input: 表示被匹配的文本

groups:表示有名的分组

在全局下也是一样因为exec永远只返回第一个匹配。

如果没有找到任何匹配就返回null,如果找到了则返回一个数组,match方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)

第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)

...

以此类推。

其中还有三个参数

index:表示匹配到的文本的第一个字符所在的索引位置

input: 表示被匹配的文本

groups:表示有名的分组

在非全局的情况下,这个方法和exec一模一样,但是在全局的情况下,差别很大,在全局的情况下,只会返回匹配到的结果,并且lastIndex始终为0, 如果没匹配到就返回null

该方法用来替换字符串,第一个参数是正则表达式,第二个参数可以是字符串也可以是函数

正则匹配测试工具

RegExp()的第二个参数主要支持g,i,m这3个修饰性字符

字符g,用来指定全局匹配

字符 i ,是用来指定大小写为等同;

字符 m 是多行一词的缩写,设置匹配模式能够在多行字符串中执行操作

var a = "javasssss"

    var s = new RegExp("a","gi")

    alert(a.match(s))

返回值为a,a

var a = "javasssss sssswww aaaaa"

    var s = new RegExp("\\b\\w","gi")

    alert(a.match(s))

返回值为j,s,a

\\b\\w是一个匹配模式,其中反斜杠表示转义序列,而双斜杠表示的是斜杠的意思,\b表示边界的意思\w表示的任意的ASCii码,指的就是每一个单词的首字母;

var a = "javasssss sssswww aaaaa"

    var r=new RegExp("\\x61")

    var s=a.match(r)

    alert(s)

x61表示的是a的十六进制的ascii码,除了十六进制以外,还可以直接使用八进制数值来匹配例如;

var a = "javasssss sssswww aaaaa"

    var r=new RegExp("\\141")

    var s=a.match(r)

    alert(s)

js中的特殊字符

\o表示空字符   

\t表示制表位

\n表示换行符

\v表示垂直制表符

\f表示换页符

\r表示回车符

\a表示alert字符

\e表示escape字符

\b表示回退字符

\cX表示控制自负^x

对于这些特殊的字符,如果在RegExp构造函数中使用,必须使用双斜杠表示专业。

定义简单的字符类

var a = "javasssss sssswww aaaaa"

    var r=new RegExp("[abcsw]","gi")

    var s=a.match(r)

    alert(s)

返回值为

查找字符串中是否有字符类中的字母

定义反义字符类

var a = "aba abd abg abe"

    var r=new RegExp("ab[^abc]","gi")

    var s=a.match(r)

    alert(s)

返回值为

第三个字符表示除了a,b,c以外的字符都可以

var r= new RegExp("[^012345679]","gi")

匹配除了数字以外任意的字符。反义字符类比简单字符类更加强大和实用

如果任意双字节的汉字,你可以这样设计

var r=new RegExp("\\u0000-\\u00ff","gi");

预定义字符类

JavaScript中的 match() 方法可以实现match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。stringObject.match(searchvalue)stringObject.match(regexp)参数说明searchvalue 必需。规定要检索的字符串值。regexp 必需。规定要匹配的模式的 RegExp 对象。如果该参数不是 RegExp 对象,则需要首先把它传递给 RegExp 构造函数,将其转换为 RegExp 对象。返回值存放匹配结果的数组。该数组的内容依赖于 regexp 是否具有全局标志 g。其他说明match() 方法将检索字符串 stringObject,以找到一个或多个与 regexp 匹配的文本。这个方法的行为在很大程度上有赖于 regexp 是否具有标志 g。如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。如果没有找到任何匹配的文本, match() 将返回 null。否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在 stringObject 中的位置,input 属性声明的是对 stringObject 的引用。如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到 stringObject 中的所有匹配子字符串。若没有找到任何匹配的子串,则返回 null。如果找到了一个或多个匹配子串,则返回一个数组。不过全局匹配返回的数组的内容与前者大不相同,它的数组元素中存放的是 stringObject 中所有的匹配子串,而且也没有 index 属性或 input 属性。注意:在全局检索模式下,match() 即不提供与子表达式匹配的文本的信息,也不声明每个匹配子串的位置。如果您需要这些全局检索的信息,可以使用 RegExp.exec()。例如:我们将使用全局匹配的正则表达式来检索字符串中的所有数字:<script type="text/javascript">var str="1 plus 2 equal 3"document.write(str.match(/\d+/g))</script>输出:1,2,3