正则表达式匹配时间区间

Python018

正则表达式匹配时间区间,第1张

正则表达式擅长的事匹配,不是判断,所以在做日期合法性判断的时候会比较复杂。所求正则表达式如下:2015-08-(3[0-1]|[1-2][0-9]|0[8-9])|2015-(10|12)-(3[0-1]|[1-2][0-9]|0[1-9])|2015-(9|11)-(30|[1-2][0-9]|0[1-9])|2016-02-([1-2][0-9]|0[1-9])|2016-(1,3,5,7,8)-(3[0-1]|[1-2][0-9]|0[1-9])|2016-(4,6,9)-(30|[1-2][0-9]|0[1-9])|2015-10-(10|0[1-9]) 解释:2015-08-(3[0-1]|[1-2][0-9]|0[8-9])# 匹配8月合法日期|2015-(10|12)-(3[0-1]|[1-2][0-9]|0[1-9])# 匹配15年大月合法日期|2015-(9|11)-(30|[1-2][0-9]|0[1-9])# 匹配15年小月合法日期|2016-02-([1-2][0-9]|0[1-9])# 匹配16年2月合法日期|2016-(1,3,5,7,8)-(3[0-1]|[1-2][0-9]|0[1-9])# 匹配16年大月|2016-(4,6,9)-(30|[1-2][0-9]|0[1-9])# 匹配16年小月|2015-10-(10|0[1-9])# 匹配16年10月# 中间用或者符号|连接表示或 如果不考虑大月小月,可以简化一点(统一使用大月的正则匹配),但是还是最少得有4行。

"/Date(1546012800000+0800)/",而我需要把它转化成这种格式:2019-05-23 12:34:22(北京时间),并作为入参传给另一个 MAPI 接口。

第一时间想到的解决办法就是看看框架中是否带有这种时间戳处理的功能,发 现大多是直接处理时间戳的,像这种:1554362965,所以需要把得到的时间格 式进行处理一下:

首先括号及括号两边的字符是不需要的,另外,+0800 是时区差,表示北京时 间,所以+0800 也可以不需要。要取出 1546012800000 至少有两种方式,第一 种就是正则表达式,第二种就是字符串截取函数 slice()、substring()、substr()。

解释一下这个正则表达式:

第一个字符“/”是正则表达式的开始,第二个字符“\”是转义符,因为字符串中带 有“/”,属于元字符,所以我们需要用转义符转义一下,/Date 是字符串中的内 容,因为格式不变,这个地方可以直接匹配。然后又出现了“\”,因为后面的

“ (”也是属于元字符,因此我们还是需要“\”转义符,之后的( ) 就是分组,\d 表 示数字,*表示数字在文本中出现零次或连续多次,+号表示以+号结尾,最后 以“/”结束整个正则表达式。

这个方法很大程度上有赖于你所写 的正则表达式是否包含 g,如果没有 g,那么 match() 方法就只能在 str 中执行 一次匹配。如果没有找到任何匹配的文本,match() 将返回 null。否则,它将 返回一个数组,其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个 元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配 的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。 index 属性声明的是匹配文本的起始字符在 str 中的位置,input 属性存放的是 你要匹配的文本。如果有 g,则 match() 方法会全局检索,找到 str 中所有匹配 的子字符串,全局匹配到子串时返回的数组中没有 index 属性或 input 属性。 上面的正则表达式还可以这样写,结果也是一样的。

直接从 Date 开始匹配,正则表达式就更简短了。

对于上面这个正则,其他的不用多解释,\w 和+号可以说一说。

\w 用来匹配字母、数字和下划线,而后面的+号表示在文本中连续出现一次或 多次。这个正则中的第三个+号是文本中的+号,由于+号是元字符,所以我们 需要用“\”进行转义一下。 另外再说一个分组的问题,如果上面的字符串我们要把+0800 也匹配进来,可 以在正则表达式中多加一对括号,像下面这样:

第一个正则表达式我们只匹配到了 1546012800000,因为它只能识别 /Date(xxx,上面这个正则表达式还可以识别/Dyzc(,例如:

元字符:有特殊含义,以至于不能表示原本意义的字符。 除了正则表达式,HTML、XML、URL,到处都有元字符,并且他们的元字符 还不一定一样。

HTML:

空格( )不表示空格, 只能用   来表示空格。

大于号(>)不能表示大于号,只能用 <来表示大于号

URL 中,例如: https://www.baidu.com/?search=x%20y

这个 URL 中的%20 其实是个空格。 因为 URL 规定里面只能包含很少的几十种 字符,其中空格就是被禁用的,不能包含空格,那不能包含空格而用户的确需 要表示空格,怎么办呢?

用另外的东西代表空格,在 URL 中,就是%20

因此

https://www.baidu.com/?search=x%20y

等于

https://www.baidu.com/?search=x y

但是下面这个 url 是不合法,所以要被「转义」为上面这个。

url 或者 cookie 中一般一大堆%数字 1、%数字 2 的,全是%开头的,这都是套 路。

正则表达式中可以用/来把元字符转义成他本来的意思,

/ =>/ ( =>( + =>+

HTML 中是以为&开头,结尾的。

URL 中是以%开头。

正则表达式是以/开头,/结尾的。

终于说完了正则表达式,下面来说说第二种获取"/Date(1546012800000+0800)/" 中 1546012800000 的方法,个人觉得用字符串截取函数来获取也同样是要抓住

不变点和变点,只有抓住这两个,就很好解决这个问题了。因为返回的时间格 式是固定的,所以我们可以从/开始数,第 6 个(index=6)开始,然后以+号结 束,拿到的刚好是 1546012800000,下面我借助一下 indexOf 来获取到+号的位置:

indexOf() 方法可返回某个指定的字符串值在字符串中首次出现的位置。第一个 参数是必须的,就是要检索的字符串值,它还可以传入第二个参数,必须是个 整数,从 0 开始,表示从字符串中开始检索的位置,比如说你想从第 6 个字符 开始检索,就可以传 5,最大的取值就是 str.length-1。如果省略就是从首字符开 始检索。

再说一下 substr()函数: substr()方法返回从指定位置开始的字符串中指定字符数的字符,第一个参数是 指定开始的位置,第二个参数是截取的长度。 这里的第二个参数长度就是用+号的位置减去前面不需要的 6 个字符,得到的就 是我们真正要的时间戳。

而 slice()、substring()就更更简单了了。

slice()和 substring()方法都是返回一个索引和另一个索引之间的字符串。所以这 里只需要传+号的位置就行,而且这两个文法第二个参数都不包含该索引位置的

字符。具体可以参考下面这篇文章。

https://juejin.im/post/59e2af3151882578cf573319

拿到时间戳之后就可以直接用框架中的工具,把 1558281600000 转换成 2019-5- 20 0:0:0。

日期格式“yyyy-MM-dd”可以使用正则表达式“\\d{4}-\d{\1-\12}-\d{\1-\31}?”来验证。

其中,“\d{4}”代表4位0-9的数字,“\d{\1-\12}”代表数字1-12,“\d{\1-\31}”代表数字1-31。

正则表达式是对字符串(包括普通字符(例如,a 到 z 之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。

正则表达式是一种文本模式,该模式描述在搜索文本时要匹配的一个或多个字符串。

扩展资料:

常用正则表达式:

1、验证用户名和密码

正则表达式:("^[a-zA-Z]\w{5,15}$")

正确格式:"[A-Z][a-z]_[0-9]"组成,并且第一个字必须为字母6~16位

2、验证电话号码

正则表达式:("^(\d{3,4}-)\d{7,8}$")

正确格式:xxx/xxxx-xxxxxxx/xxxxxxxx;

3、验证手机号码

正则表达式:"^1[3|4|5|7|8][0-9]{9}$"

4、验证Email地址

正则表达式:("^\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*$")

5、只能输入由数字和26个英文字母组成的字符串

正则表达式:("^[A-Za-z0-9]+$");

6、整数或者小数

正则表达式:^[0-9]+([.][0-9]+){0,1}$

参考资料来源:百度百科-正则表达式