正则匹配模式分为两种,一种是贪婪模式,另一种是非贪婪模式
贪婪模式:在遇到歧义时候尽可能的多的匹配符合的结果
非贪婪匹配:在遇到歧义时候匹配到一次符合的结果就不匹配了
js默认是贪婪匹配模式,贪婪模式变成非贪婪模式只需要在贪婪量词({n, }, {n, m}, + , ?, *)后面加一个?就行了
附加: 正则匹配中?的几种用法
正则匹配的前瞻就是给正则匹配的选项定义一个断言,或者说是一个条件比如:我要匹配一个字母,但是我的需求是字母后面必须是跟着一个数字的情况,那么这种场景是怎么实现了,就是用到前瞻的概念,那么我想要他的前面也要是一个数字怎么办了,这就是后顾。
前瞻后顾的描述
正则匹配新特性
以上的三个匹配形式都是不被捕获的,其中前两个是不匹配的,他只是用来当作条件来用,第三个是要被匹配的
1:任何元字符在没有写量词的情况下,只匹配一次
2:写了量词,默认是贪婪匹配
3:正则匹配一旦全部找到就不会在继续去匹配,除非你设置了全局g
4:正则匹配按照匹配规如果中间中断没有匹配到,并且字符串没有匹配完,会继续按照匹配规则重新匹配
5:(pattern)如果匹配到了很多结果,只捕获最后一次匹配到的结果
6:任何量词都只作用于前面的元字符
1:source 2:global 3:ingoreCase 4:multiline 5:lastIndex
字符串满足正则匹配规则就会返回true,但是如果正则匹配里面含有全局的话,那么多运行几遍会报错,因为正则每次匹配开始都是看lastIndex的,全局情况下lastIndex每次执行都会被改变
如果没有找到任何匹配就返回null,如果找到了则返回一个数组,exec方法返回的数组的第 0 个元素是与正则表达式相匹配的文本
第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)
第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)
...
以此类推。
其中还有三个参数
index:表示匹配到的文本的第一个字符所在的索引位置
input: 表示被匹配的文本
groups:表示有名的分组
在全局下也是一样因为exec永远只返回第一个匹配。
如果没有找到任何匹配就返回null,如果找到了则返回一个数组,match方法返回的数组的第 0 个元素是与正则表达式相匹配的文本
第 1 个元素是 正则匹配到 的第 1 个子表达式相匹配的文本(如果有的话)
第 2 个元素是正则匹配到 的第 2 个子表达式相匹配的文本(如果有的话)
...
以此类推。
其中还有三个参数
index:表示匹配到的文本的第一个字符所在的索引位置
input: 表示被匹配的文本
groups:表示有名的分组
在非全局的情况下,这个方法和exec一模一样,但是在全局的情况下,差别很大,在全局的情况下,只会返回匹配到的结果,并且lastIndex始终为0, 如果没匹配到就返回null
该方法用来替换字符串,第一个参数是正则表达式,第二个参数可以是字符串也可以是函数
正则匹配测试工具
String.prototype.finded = function(){
var arg = arguments
var me = this.toLowerCase()
var re = false
var list = []
if (arg.length >0)
{list = arg[0].toString().split(",")}
for (var i=0i<list.lengthi++)
{ if (me.indexOf(list[i].toLowerCase()) >= 0)
{ re = truebreak }
js常用的字符串方法分析
##字符串##
字符串:由0个或多个字符组成,被成对的英文单引号或双引号包含起来的。字符编码:每一个字符在计算机存储的编号。计算机会保存有一套或几套用于标注编号与字符对应关系的字典。(字符集)计算机存储单位位:bit->0/1能存2个字节:byte->8bit可存256个不同的字。
KB:1KB=1024byte;字符串的操作,属性(此中str代表字符串)length:只读属性,表示字符串的长度str.charAt(index):返回str中index位置上对应的字符,若超出当前位置返回空字符。str.indexOf(char):返回char在str中首次出现的位置。
从左至右,若不存在返回-1.str.lastIndexOf(char):返回char在str中最后一次出现的位置,从右至左,若不存在返回-1.str.charCodeAt()str.substring(start,end):截取并返回字符串,从start位置开始到end位置结束(不包含end位置的字符)start:起始位默认为0,如果是负数,转成为0.end:结束位,默认为字符串的长度,如果是负数,转成0.若start比end大会交换位置。
str.substr(start,count):截取从start位置开始,截取count个字符,并返回start:截取的起始位置,默认为0,支持负数count:截取的个数,默认为length;不支持负数str.slice(start, end)截取从start的位置开始,到end位置结束<不包含end位置上的字符>的字符,并返回start: 起始位,默认为0,如果是负数,则用字符串的长度+这个负数值,或者是从右向左数start位确定起始位置。
/[\u4e00-\u9fa5]/ 正则只能匹配中文,记住是中文,匹配汉字是不正确
/\p{Unified_Ideograph}/u是正确的,不需要维护,匹配所有汉字。
移步下面链接:
JavaScript 正则表达式匹配汉字
如果要匹配所有(结尾加上g):
reg = /\p{Unified_Ideograph}/ug
eg:
str.replace(reg, 'aa')