JS正则表达式详解

JavaScript08

JS正则表达式详解,第1张

RegExp是JS的正则表达式对象,实例化一个RegExp对象有 字面量 构造函数 2种方式。

字面量实例化RegExp对象

var reg=/js/gi

开始和结束的斜线/是正则表达式的边界,//中间的文本是正则表达式文本,后面的gi是正则表达式的修饰符。

构造函数实例化RegExp对象

var reg=new Regex(‘js’,’gi’)

第一个参数是正则表达式文本,第二个参数是正则表达式修饰符。

global:RegExp 对象是否具有标志 g。

ignoreCase:RegExp 对象是否具有标志 i。

lastIndex:一个整数,标示开始下一次匹配的字符位置。

multiline:RegExp 对象是否具有标志 m。

source:正则表达式的源文本。

RegExp 对象有 3 个方法:test()、exec() 以及 compile()。

test()

test() 方法检索字符串中的指定值。返回值是 true 或 false。

示例:

var reg=/js/gi

var result=reg.test(‘I like js’)

结果:true

exec()

exec() 方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回 null。

示例:

var reg=/js/gi

var result=reg.exec(‘I like JS’)

结果:JS

compile()

compile() 方法用于改变 RegExp。

compile() 既可以改变检索模式,也可以添加或删除第二个参数。

g:global全文搜索,如果不添加此参数,搜索到第一个匹配就会停止

i:ignore case 不区分大小写,默认是区分大小写的

m:multiple lines 多行搜索,默认只搜索第一行

正则表达式文本部分包含 原义文本字符 元字符, 其中的原义文本字符代表字符本身意义的字符,如abc123之类的字符。

元字符代表有特殊含义非字母字符,如\b、\w、\d、+、*、? 等。

常用的元字符

更多的JS正则元字符请参考: http://www.runoob.com/regexp/regexp-metachar.html

一般情况下正则表达式中的一个字符对应字符串中的一个字符,如表达式ab的含义是ab。

表达式中用 [] 来定义一个字符类,表示可以匹配[]里面的这类字符,是一个泛指,而不是一一对应的关系。

如表达式[abc123],表示有其中一个字符串都可以匹配。

在字符类里面使用横线-连接2个数字或者字母就可以构建一个范围类,如[a-zA-z0-9-]表示可以匹配26个大小写字母和0-9的全部数字以及横线-。

注意,要匹配横线”-“,必须把横线放在最后面。

预定义类可以理解为JS默认给我们写好的范围类,让我们可以使用一个简单的元字符来使用它。如”\w”就是一个预定义类,它等价于范围类[A-Za-z0-9_];“.”可以匹配除 “\n” 之外的任何单个字符。

边界包含2种,一种是以字符串开始或结尾的边界,另一种是单词边界

量词表示可以匹配连续多次的元字符

JS正则表达式默认是贪婪模式匹配,它会以最多匹配原则进行查找,非贪婪模式可以让表达式以最少匹配原则进行查找。

非贪婪模式只需要在量词后面加上”?”即可,如”123456789″字符串想以3个数字为一组进行匹配表达式写法/\d{3,5}?/g。

表达式中用 () 来定义一个分组,使元字符可以作用于一个表达式字符串组合,如/(js|php){3}/gi。

表达式中的每一个分组匹配的内容都是一个可以捕获的变量,可以使用$1、$2、$3… 来取值,如表达式/(\d{4})-(\d{2})-(\d{2})/中包含$1、$2、$3。如果想忽略分组匹配的内容,需要在分组前面增加“?:”,就可以得到分组匹配之外的内容。

前瞻就是正则表达式后面加上断言部分,它不但要匹配表达式部分,还需要满足断言部分,匹配的结果不会包含断言部分。

正向前瞻 exp(?=assert) 如 “\w(?=\d)”

负向前瞻 exp(?!assert) 如 “\w(?!\d)”

match()

stringObject.match(regexp)

match() 方法可在字符串内检索指定的值,或找到一个或多个正则表达式的匹配。

如果 regexp 没有标志 g,那么 match() 方法就只能在 stringObject 中执行一次匹配。

如果没有找到任何匹配的文本, match() 将返回 null。

否则,它将返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。

search()

stringObject.search(regexp)

search() 方法不执行全局匹配,它将忽略标志 g。它同时忽略 regexp 的 lastIndex 属性,并且总是从字符串的开始进行检索,这意味着它总是返回 stringObject 的第一个匹配的位置。

replace()

stringObject.replace(regexp/substr,replacement)

字符串 stringObject 的 replace() 方法执行的是查找并替换的操作。它将在 stringObject 中查找与 regexp 相匹配的子字符串,然后用 replacement 来替换这些子串。如果 regexp 具有全局标志 g,那么 replace() 方法将替换所有匹配的子串。否则,它只替换第一个匹配子串。

replacement 可以是字符串,也可以是函数。如果它是字符串,那么每个匹配都将由字符串替换。但是 replacement 中的 $ 字符具有特定的含义。如下表所示,它说明从模式匹配得到的字符串将用于替换。

split()

stringObject.split(separator,howmany)

如果 separator 是包含子表达式的正则表达式,那么返回的数组中包括与这些子表达式匹配的字串(但不包括与整个正则表达式匹配的文本)

正则表达式语法语意测试工具: https://regexper.com/

1定义正则表达式

在js中定义正则表达式很简单,有两种方式,一种是通过构造函数,一种是通过//,也就是两个斜杠。

例如

代码如下:

var re =new RegExp("\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

使用构造函数定义正则表达式,注意大小写,负责就会不起作用。由于构造函数的参数是一个字符串,也可以是两个斜杠的方式定义,遇到一些特殊字符就需要使用\进行转义

通过双斜杠的方式定义同样的正则表达式

代码如下:

var re =/\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

代码如下:

var re =new RegExp( /^\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/)

可以和构造函数达到同样的效果,但仔细分析,发现,通过构造函数需要更多的转义字符\

2关于验证的三个正则表达式方法

使用正则表达式的主要有字符串的方法match,正则表达式的方法exec,test

正则表达式方法test测试给定的字符串是否满足正则表达式,返回值是bool类型的,只有真和假,如果只是单纯的判断,不需要其他的处理,可以使用尤其是验证时。

代码如下:

function test(){

var text="index.aspx?test=1&ww=2&www=3"//

var re =/\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re =new RegExp("\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

var result= re.test(text)

if(result)

{

alert("ok")

}else

{

alert("err")

}

}

正则表达式方法exec测试给定的字符串是否满足正则表达式,返回匹配到的字符串,如果没有匹配的则返回null,和test基本一致,如果需要获取匹配的各个子字符串,可以使用下标的方式,把上边的test的例子可以改写如下

代码如下:

function test(){

var text="index.aspx?test=1&ww=2&www=3"

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re =new RegExp( "\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")

var result= re.exec(text)

if(result)

{

alert("ok")

alert(result) // 是?test=1&ww=2&www=3,ww=2&

alert(result[0]+",0")//是?test=1&ww=2&www=3

alert(result[1]+",1")//是ww=2&

}else

{

alert("err")

}

}

match其实是字符串的方法,但参数确是一个正则表达式,把上边的例子改写后,如下

代码如下:

function test(){

var text="index.aspx?test=1&ww=234"//

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re2 = "(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}"

var result= text.match(re)

if(result)

{

alert(result)//?test=1&ww=234,test=1&

alert(result[0]+",0")//?test=1&ww=234

alert(result[1]+",1")//test=1&

}else

{

alert("err")

}

}

其实字符串类还有多个函数可以传递正则表达式,split,search,replace等但这些方法已经不适合验证了。

代码如下:

function test(){

var text="index.aspx?test=1&ww=234"//

var re = /\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/

// var re2 = "(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}"

var result= text.split(re)

alert(result)

alert(result[0]+",0")

alert(result[1]+",1")

}

3正则表达式式的转义字符

在正则表达式中会经常出现转义字符,例如问号?在正则表达式中有特殊的含义,如果需要匹配问号?就需要转义,使用转义字符反斜杠\

如下两个都是匹配问号开头的一段字符串

代码如下:

function test(){

var text="?test=1&ww=2&www=3"

var re = /^\?(\w{1,}=\w{1,}&){1,}\w{1,}=\w{1,}/// \?表示配置问号?

// var re =new RegExp( "^\\?(\\w{1,}=\\w{1,}&){1,}\\w{1,}=\\w{1,}")// \\?表示配置问号?

var result= re.exec(text)

if(result)

{

alert("ok")

alert(result)

alert(result[0]+",0")

alert(result[1]+",1")

}else

{

alert("err")

}

}

用户名或昵称 : ^[\u4e00-\u9fa5A-Za-z0-9-_]*$——只能中英文,数字,下划线,减号

用户密码: ^[a-zA-Z]\w{5,17}$ 正确格式为——以字母开头,长度在6-18之间,只能包含字符、数字和下划线。

汉字 :^[\u4e00-\u9fa5],{0,}$

Email地址 :^\w+[-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$

                     ^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$

IP地址 :^(\d{1,2}|1\d\d|2[0-4]\d|25[0-5])(\.(\d{1,2}|1\d\d|2[0-4]\d|25[0-5])){3}$

日期 格式是否为YYYY-MM-DD:^\d{4}-(0?[1-9]|1[0-2])-(0?[1-9]|[1-2]\d|3[0-1])$/

时间 格式是否为hh:mm:ss:^([0-1]\\d|2[0-3]):[0-5]\\d:[0-5]\\d$

InternetURL :^http://([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ ;^[a-zA-z]+://(w+(-w+)*)(.(w+(-w+)*))*(?S*)?$

                            ^http:\/\/[A-Za-z0-9]+\.[A-Za-z0-9]+[\/=\?%\-&_~`@[\]\':+!]*([^<>\"\"])*$

电话号码 :^(\(\d{3,4}\)|\d{3,4}-)?\d{7,8}$——正确格式为:XXXX-XXXXXXX,XXXX-XXXXXXXX,XXX-XXXXXXX,XXX-XXXXXXXX,XXXXXXX,XXXXXXXX。

                        ^((\(\d{2,3}\))|(\d{3}\-))?(\(0\d{2,3}\)|0\d{2,3}-)?[1-9]\d{6,7}(\-\d{1,4})?$

手机号码 :^0?(13[0-9]|15[012356789]|18[0236789]|14[57])[0-9]{8}$:打长途时一般要在手机号码前加0。

身份证号 (15位或18位数字):^\d{15}(\d{2}[A-Za-z0-9])?$

QQ号码 : /^[1-9]\d{4,8}$/

验证是否含有 ^%&',=?$\" 等字符:[^%&',=?$\x22]+

验证一年的12个月:^(0?[1-9]|1[0-2])$ 正确格式为:“01”-“09”和“1”“12”

验证一个月的31天:^((0?[1-9])|((1|2)[0-9])|30|31)$ 正确格式为:01、09和1、31。

验证数字:^[0-9]*$

验证n位的数字:^\d{n}$  

验证至少n位数字:^\d{n,}$ 

验证m-n位的数字:^\d{m,n}$

验证零和非零开头的数字:^(0|[1-9][0-9]*)$

验证有两位小数的正实数:^[0-9]+(.[0-9]{2})?$

验证有1-3位小数的正实数:^[0-9]+(.[0-9]{1,3})?$

验证非零的正整数:^\+?[1-9][0-9]*$

验证非零的负整数:^\-[1-9][0-9]*$

验证非负整数(正整数 + 0) ^\d+$

验证非正整数(负整数 + 0) ^((-\d+)|(0+))$

验证长度为3的字符:^.{3}$

验证由26个英文字母组成的字符串:^[A-Za-z]+$

验证由26个大写英文字母组成的字符串:^[A-Z]+$

验证由26个小写英文字母组成的字符串:^[a-z]+$

验证由数字和26个英文字母组成的字符串:^[A-Za-z0-9]+$

验证由数字、26个英文字母或者下划线组成的字符串:^\w+$

整数:^-?\d+$

非负浮点数(正浮点数 + 0):^\d+(\.\d+)?$

正浮点数: ^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

非正浮点数(负浮点数 + 0):^((-\d+(\.\d+)?)|(0+(\.0+)?))$

负浮点数: ^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

浮点数 :^(-?\d+)(\.\d+)?$

双精度:^[-\+]?\d+(\.\d+)?$

//判断输入的字符是否为中文

function IsChinese(){

    var str = document.getElementById('str').value.trim()

    if(str.length!=0){

        reg=/^[\u0391-\uFFE5]+$/

        if(!reg.test(str)){

            alert("对不起,您输入的字符串类型格式不正确!")

        }

    }

}

//判断输入的数字不大于某个特定的数字

function MaxValue(){

    var val = document.getElementById('str').value.trim()

    if(str.length!=0){

        reg=/^[-+]?\d*$/

        if(!reg.test(str)){//判断是否为数字类型

            if(val>parseInt('123')){//“123”为自己设定的最大值

                alert('对不起,您输入的数字超出范围')

            }

        }

    }

}

//为上面提供各个JS验证方法提供.trim()属性

String.prototype.trim=function(){

    return this.replace(/(^\s*)|(\s*$)/g, "")

}

var patterms = newObject()

//验证IP

patterms.ip = /^(\d{1,2}|1\d\d|2[0-4]\d|25[0-5])(\.(\d{1,2}|1\d\d|2[0-4]\d|25[0-5])){3}$/

//验证EMAIL

patterms.email = /^[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+(\.[a-zA-Z0-9_-]+)+$/

//验证函数

functionverify(str,pat){

    var thePat = patterms[pat]

    if(thePat.test(str)){

        return true

    }else{

        return false

    }

}

//测试alert(verify("[email protected]","email")+","+verify("192.168.1.1","ip")+","+verify("192.168","ip"))

本文摘自: js正则表达式验证大全