JS正则表达式详解

2023-02-21 20:14:02JavaScript019

JS正则表达式详解,第1张

RegExp是JS的正则表达式对象，实例化一个RegExp对象有 字面量 和 构造函数 2种方式。

字面量实例化RegExp对象

var reg=/js/gi

开始和结束的斜线/是正则表达式的边界，//中间的文本是正则表达式文本，后面的gi是正则表达式的修饰符。

构造函数实例化RegExp对象

var reg=new Regex(‘js’,’gi’)

第一个参数是正则表达式文本，第二个参数是正则表达式修饰符。

global：RegExp 对象是否具有标志 g。

ignoreCase：RegExp 对象是否具有标志 i。

lastIndex：一个整数，标示开始下一次匹配的字符位置。

multiline：RegExp 对象是否具有标志 m。

source：正则表达式的源文本。

RegExp 对象有 3 个方法：test()、exec() 以及 compile()。

test()

test() 方法检索字符串中的指定值。返回值是 true 或 false。

示例：

var reg=/js/gi

var result=reg.test(‘I like js’)

结果：true

exec()

exec() 方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配，则返回 null。

示例：

var reg=/js/gi

var result=reg.exec(‘I like JS’)

结果：JS

compile()

compile() 方法用于改变 RegExp。

compile() 既可以改变检索模式，也可以添加或删除第二个参数。

g：global全文搜索，如果不添加此参数，搜索到第一个匹配就会停止

i：ignore case 不区分大小写，默认是区分大小写的

m：multiple lines 多行搜索，默认只搜索第一行

正则表达式文本部分包含 原义文本字符 和 元字符， 其中的原义文本字符代表字符本身意义的字符，如abc123之类的字符。

元字符代表有特殊含义非字母字符，如\b、\w、\d、+、*、? 等。

常用的元字符

更多的JS正则元字符请参考： http://www.runoob.com/regexp/regexp-metachar.html

一般情况下正则表达式中的一个字符对应字符串中的一个字符，如表达式ab的含义是ab。

表达式中用 [] 来定义一个字符类，表示可以匹配[]里面的这类字符，是一个泛指，而不是一一对应的关系。

如表达式[abc123]，表示有其中一个字符串都可以匹配。

在字符类里面使用横线-连接2个数字或者字母就可以构建一个范围类，如[a-zA-z0-9-]表示可以匹配26个大小写字母和0-9的全部数字以及横线-。

注意，要匹配横线”-“，必须把横线放在最后面。

预定义类可以理解为JS默认给我们写好的范围类，让我们可以使用一个简单的元字符来使用它。如”\w”就是一个预定义类，它等价于范围类[A-Za-z0-9_]；“.”可以匹配除 “\n” 之外的任何单个字符。

边界包含2种，一种是以字符串开始或结尾的边界，另一种是单词边界

量词表示可以匹配连续多次的元字符

JS正则表达式默认是贪婪模式匹配，它会以最多匹配原则进行查找，非贪婪模式可以让表达式以最少匹配原则进行查找。

非贪婪模式只需要在量词后面加上”?”即可，如”123456789″字符串想以3个数字为一组进行匹配表达式写法/\d{3,5}?/g。

表达式中用 () 来定义一个分组，使元字符可以作用于一个表达式字符串组合，如/(js|php){3}/gi。

表达式中的每一个分组匹配的内容都是一个可以捕获的变量，可以使用$1、$2、$3… 来取值，如表达式/(\d{4})-(\d{2})-(\d{2})/中包含$1、$2、$3。如果想忽略分组匹配的内容，需要在分组前面增加“?:”，就可以得到分组匹配之外的内容。

前瞻就是正则表达式后面加上断言部分，它不但要匹配表达式部分，还需要满足断言部分，匹配的结果不会包含断言部分。

正向前瞻 exp(?=assert) 如 “\w(?=\d)”

负向前瞻 exp(?!assert) 如 “\w(?!\d)”

match()

stringObject.match(regexp)

match() 方法可在字符串内检索指定的值，或找到一个或多个正则表达式的匹配。

如果 regexp 没有标志 g，那么 match() 方法就只能在 stringObject 中执行一次匹配。

如果没有找到任何匹配的文本， match() 将返回 null。

否则，它将返回一个数组，其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本，而其余的元素存放的是与正则表达式的子表达式匹配的文本。

search()

stringObject.search(regexp)

search() 方法不执行全局匹配，它将忽略标志 g。它同时忽略 regexp 的 lastIndex 属性，并且总是从字符串的开始进行检索，这意味着它总是返回 stringObject 的第一个匹配的位置。

replace()

stringObject.replace(regexp/substr,replacement)

字符串 stringObject 的 replace() 方法执行的是查找并替换的操作。它将在 stringObject 中查找与 regexp 相匹配的子字符串，然后用 replacement 来替换这些子串。如果 regexp 具有全局标志 g，那么 replace() 方法将替换所有匹配的子串。否则，它只替换第一个匹配子串。

replacement 可以是字符串，也可以是函数。如果它是字符串，那么每个匹配都将由字符串替换。但是 replacement 中的 $ 字符具有特定的含义。如下表所示，它说明从模式匹配得到的字符串将用于替换。

split()

stringObject.split(separator,howmany)

如果 separator 是包含子表达式的正则表达式，那么返回的数组中包括与这些子表达式匹配的字串（但不包括与整个正则表达式匹配的文本）

正则表达式语法语意测试工具： https://regexper.com/

js匹配是js中比较重要的一个概念，我们在工作中经常用到，但是往往都是记得不是很清楚，或者有些遗忘，这次记录总结一下，让自己加深一下印象，同时也会小伙伴们提供查阅资料的地方

正则匹配模式分为两种，一种是贪婪模式，另一种是非贪婪模式

贪婪模式：在遇到歧义时候尽可能的多的匹配符合的结果

非贪婪匹配：在遇到歧义时候匹配到一次符合的结果就不匹配了

js默认是贪婪匹配模式,贪婪模式变成非贪婪模式只需要在贪婪量词（{n, }, {n, m}, + , ?, *）后面加一个?就行了

附加：正则匹配中?的几种用法

正则匹配的前瞻就是给正则匹配的选项定义一个断言，或者说是一个条件比如：我要匹配一个字母，但是我的需求是字母后面必须是跟着一个数字的情况，那么这种场景是怎么实现了，就是用到前瞻的概念，那么我想要他的前面也要是一个数字怎么办了，这就是后顾。

前瞻后顾的描述

正则匹配新特性

以上的三个匹配形式都是不被捕获的，其中前两个是不匹配的，他只是用来当作条件来用，第三个是要被匹配的

1：任何元字符在没有写量词的情况下，只匹配一次

2：写了量词，默认是贪婪匹配

3：正则匹配一旦全部找到就不会在继续去匹配，除非你设置了全局g

4：正则匹配按照匹配规如果中间中断没有匹配到，并且字符串没有匹配完，会继续按照匹配规则重新匹配

5：（pattern）如果匹配到了很多结果，只捕获最后一次匹配到的结果

6：任何量词都只作用于前面的元字符

1:source 2:global 3:ingoreCase 4:multiline 5:lastIndex

字符串满足正则匹配规则就会返回true,但是如果正则匹配里面含有全局的话，那么多运行几遍会报错，因为正则每次匹配开始都是看lastIndex的，全局情况下lastIndex每次执行都会被改变

如果没有找到任何匹配就返回null,如果找到了则返回一个数组，exec方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是正则匹配到的第 1 个子表达式相匹配的文本（如果有的话）

第 2 个元素是正则匹配到的第 2 个子表达式相匹配的文本（如果有的话）

...

以此类推。

其中还有三个参数

index:表示匹配到的文本的第一个字符所在的索引位置

input: 表示被匹配的文本

groups:表示有名的分组

在全局下也是一样因为exec永远只返回第一个匹配。

如果没有找到任何匹配就返回null,如果找到了则返回一个数组，match方法返回的数组的第 0 个元素是与正则表达式相匹配的文本

第 1 个元素是正则匹配到的第 1 个子表达式相匹配的文本（如果有的话）

第 2 个元素是正则匹配到的第 2 个子表达式相匹配的文本（如果有的话）

...

以此类推。

其中还有三个参数

index:表示匹配到的文本的第一个字符所在的索引位置

input: 表示被匹配的文本

groups:表示有名的分组

在非全局的情况下，这个方法和exec一模一样，但是在全局的情况下，差别很大，在全局的情况下，只会返回匹配到的结果，并且lastIndex始终为0，如果没匹配到就返回null

该方法用来替换字符串，第一个参数是正则表达式，第二个参数可以是字符串也可以是函数

正则匹配测试工具

一. 正则表达式

正则表达式：其实就是一种匹配规则，用于检索字符串

定义正则表达式的两种方式：1.直接定义 2.构造函数定义

那么正则表达式正则强大的地方是它可以写通配符(拥有特殊含义的字符)

二. 通配符

\w 表示：字母、数字、下划线

\W 表示：除了字母、数字、下划线以外的字符

\d 表示：数字

\D 表示：非数字

^ 表示：以^符号后面的第一个字符开头

表示：以表示：以符号前面的第一个字符结尾

{n} 表示：重复n次

{n,m} 表示：重复n到m次

[xyz] 表示：其中任意一个字符

+ 表示：重复前一项1次或多次等价于 {1,}

* 表示：重复前一项0次或多次等价于 {0,}

? 表示：重复前一项0次或1次等价于 {0,1}

. 表示：除了换行符以外的任意一个字符

\. 表示：.字符 ^ 表示：^ \表示：表示：

可以用()将多个字符作为一个整体

\w 等价于 [0-9a-zA-Z_]

| 表示：或者

[\u4E00-\u9FA5] 是常用汉字的unicode编码范围

三. 正则练习

四. 正则表达式配合字符串的方法

replace()方法

默认情况下，replace()方法，只会替换字符串中匹配的第一段内容

使用正则表达式，添加全局匹配修饰符g，可以替换匹配全部内容

使用正则表达式，添加忽略大小写修饰符i，在匹配内容时会忽略大小写

search()方法

可以通过正则表达式查找位置

五. 添加学生练习

<!DOCTYPE html>

<html>

<head>

<style>

.err{

color: red

}

.ok{

color: green

}

</style>

</head>

<body>

<form>

<table>

<tr>

<td>

</td>

</tr>

<tr>

<td>

</td>

</tr>

<tr>

<td>

<input checked name="sex" type="radio" value="0">男

<input name="sex" type="radio" value="1">女

</td>

</tr>

<tr>

<td>

<input name="hobby" type="checkbox" value="抽烟">抽烟

<input name="hobby" type="checkbox" value="喝酒">喝酒

<input name="hobby" type="checkbox" value="烫头">烫头

<input name="hobby" type="checkbox" value="睡觉">睡觉

</td>

</tr>

<tr>

<td>

</select>

<span id="gradeMsg">必须要选择一个年级</span>

</td>

</tr>

<tr>

<td>

<span id="emailMsg">请输入正确的邮箱格式</span>

</td>

</tr>

<tr>

<td>

<span id="phoneMsg">请输入正确的电话格式</span>

</td>

</tr>

<tr>

<td>

<span id="bornDateMsg">请输入正确日期格式</span>

</td>

</tr>

<tr>

<td>

</td>

</tr>

</table>

</form>

//获取姓名文本框

let name = document.querySelector('#name')

//获取年龄文本框

let age = document.querySelector('#age')

//表单的提交事件

document.querySelector('form').onsubmit = function(){

// 返回true提交表单，返回false不提交表单

if(checkName() &checkAge()){

return true

}else{

return false

}

//姓名文本框失去焦点

name.onblur = checkName

//验证姓名

function checkName(){

//定义验证姓名的正则

let reg = /^[\u4E00-\u9FA5]{2,4}$/

// 调用验证方法

return checkInput("#nameMsg",name,reg,'姓名正确','姓名必须是2-4位汉字')

}

//年龄文本框失去焦点

age.onblur = checkAge

//验证年龄

function checkAge(){

//定义验证年龄的正则

let reg = /^\d{1,2}$|^1([0-1]\d)|20$/

// 调用验证方法

return checkInput("#ageMsg",age,reg,'年龄正确','年龄必须是0-120之间')

}

//验证方法，参数分别是：span元素Id，表单元素对象，正则规则，验证成功消息，验证失败消息

function checkInput(spanId,_this,reg,okMsg,errMsg){

// 获取消息span

let span = document.querySelector(spanId)

//获取信息

let val = _this.value

if(!reg.test(val)){

span.className="err"

span.innerHTML = errMsg

return false //验证失败返回false

}else{

span.className="ok"

span.innerHTML = okMsg

return true //验证成功返回true

}

</script>

</body>

</html>

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：台山舞蹈上班时间

# 下一篇：css设置表单样式用户名和密码图片不一样

推荐阅读

热门文章

最新发布

标签列表

JS正则表达式详解

给您推荐相同类型的内容：