正则表达式匹配时间区间

2023-03-05 00:04:01Python018

正则表达式匹配时间区间,第1张

正则表达式擅长的事匹配，不是判断，所以在做日期合法性判断的时候会比较复杂。所求正则表达式如下：2015-08-(3[0-1]|[1-2][0-9]|0[8-9])|2015-(10|12)-(3[0-1]|[1-2][0-9]|0[1-9])|2015-(9|11)-(30|[1-2][0-9]|0[1-9])|2016-02-([1-2][0-9]|0[1-9])|2016-(1,3,5,7,8)-(3[0-1]|[1-2][0-9]|0[1-9])|2016-(4,6,9)-(30|[1-2][0-9]|0[1-9])|2015-10-(10|0[1-9]) 解释：2015-08-(3[0-1]|[1-2][0-9]|0[8-9])# 匹配8月合法日期|2015-(10|12)-(3[0-1]|[1-2][0-9]|0[1-9])# 匹配15年大月合法日期|2015-(9|11)-(30|[1-2][0-9]|0[1-9])# 匹配15年小月合法日期|2016-02-([1-2][0-9]|0[1-9])# 匹配16年2月合法日期|2016-(1,3,5,7,8)-(3[0-1]|[1-2][0-9]|0[1-9])# 匹配16年大月|2016-(4,6,9)-(30|[1-2][0-9]|0[1-9])# 匹配16年小月|2015-10-(10|0[1-9])# 匹配16年10月# 中间用或者符号|连接表示或如果不考虑大月小月，可以简化一点（统一使用大月的正则匹配），但是还是最少得有4行。

"/Date(1546012800000+0800)/"，而我需要把它转化成这种格式:2019-05-23 12:34:22(北京时间)，并作为入参传给另一个 MAPI 接口。

第一时间想到的解决办法就是看看框架中是否带有这种时间戳处理的功能，发现大多是直接处理时间戳的，像这种:1554362965，所以需要把得到的时间格式进行处理一下:

首先括号及括号两边的字符是不需要的，另外，+0800 是时区差，表示北京时间，所以+0800 也可以不需要。要取出 1546012800000 至少有两种方式，第一种就是正则表达式，第二种就是字符串截取函数 slice()、substring()、substr()。

解释一下这个正则表达式:

第一个字符“/”是正则表达式的开始，第二个字符“\”是转义符，因为字符串中带有“/”，属于元字符，所以我们需要用转义符转义一下，/Date 是字符串中的内容，因为格式不变，这个地方可以直接匹配。然后又出现了“\”，因为后面的

“ (”也是属于元字符，因此我们还是需要“\”转义符，之后的( ) 就是分组，\d 表示数字，*表示数字在文本中出现零次或连续多次，+号表示以+号结尾，最后以“/”结束整个正则表达式。

这个方法很大程度上有赖于你所写的正则表达式是否包含 g，如果没有 g，那么 match() 方法就只能在 str 中执行一次匹配。如果没有找到任何匹配的文本，match() 将返回 null。否则，它将返回一个数组，其中存放了与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本，而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外，返回的数组还含有两个对象属性。 index 属性声明的是匹配文本的起始字符在 str 中的位置，input 属性存放的是你要匹配的文本。如果有 g，则 match() 方法会全局检索，找到 str 中所有匹配的子字符串，全局匹配到子串时返回的数组中没有 index 属性或 input 属性。上面的正则表达式还可以这样写，结果也是一样的。

直接从 Date 开始匹配，正则表达式就更简短了。

对于上面这个正则，其他的不用多解释，\w 和+号可以说一说。

\w 用来匹配字母、数字和下划线，而后面的+号表示在文本中连续出现一次或多次。这个正则中的第三个+号是文本中的+号，由于+号是元字符，所以我们需要用“\”进行转义一下。另外再说一个分组的问题，如果上面的字符串我们要把+0800 也匹配进来，可以在正则表达式中多加一对括号，像下面这样:

第一个正则表达式我们只匹配到了 1546012800000，因为它只能识别 /Date(xxx，上面这个正则表达式还可以识别/Dyzc(，例如：

元字符:有特殊含义，以至于不能表示原本意义的字符。除了正则表达式，HTML、XML、URL，到处都有元字符，并且他们的元字符还不一定一样。

HTML:

空格( )不表示空格，只能用来表示空格。

大于号(>)不能表示大于号，只能用 <来表示大于号

URL 中，例如: https://www.baidu.com/?search=x%20y

这个 URL 中的%20 其实是个空格。因为 URL 规定里面只能包含很少的几十种字符，其中空格就是被禁用的，不能包含空格，那不能包含空格而用户的确需要表示空格，怎么办呢?

用另外的东西代表空格，在 URL 中，就是%20

因此

https://www.baidu.com/?search=x%20y

等于

https://www.baidu.com/?search=x y

但是下面这个 url 是不合法，所以要被「转义」为上面这个。

url 或者 cookie 中一般一大堆%数字 1、%数字 2 的，全是%开头的，这都是套路。

正则表达式中可以用/来把元字符转义成他本来的意思，

/ =>/ ( =>( + =>+

HTML 中是以为&开头，结尾的。

URL 中是以%开头。

正则表达式是以/开头，/结尾的。

终于说完了正则表达式，下面来说说第二种获取"/Date(1546012800000+0800)/" 中 1546012800000 的方法，个人觉得用字符串截取函数来获取也同样是要抓住

不变点和变点，只有抓住这两个，就很好解决这个问题了。因为返回的时间格式是固定的，所以我们可以从/开始数，第 6 个(index=6)开始，然后以+号结束，拿到的刚好是 1546012800000，下面我借助一下 indexOf 来获取到+号的位置:

indexOf() 方法可返回某个指定的字符串值在字符串中首次出现的位置。第一个参数是必须的，就是要检索的字符串值，它还可以传入第二个参数，必须是个整数，从 0 开始，表示从字符串中开始检索的位置，比如说你想从第 6 个字符开始检索，就可以传 5，最大的取值就是 str.length-1。如果省略就是从首字符开始检索。

再说一下 substr()函数: substr()方法返回从指定位置开始的字符串中指定字符数的字符，第一个参数是指定开始的位置，第二个参数是截取的长度。这里的第二个参数长度就是用+号的位置减去前面不需要的 6 个字符，得到的就是我们真正要的时间戳。

而 slice()、substring()就更更简单了了。

slice()和 substring()方法都是返回一个索引和另一个索引之间的字符串。所以这里只需要传+号的位置就行，而且这两个文法第二个参数都不包含该索引位置的

字符。具体可以参考下面这篇文章。

https://juejin.im/post/59e2af3151882578cf573319

拿到时间戳之后就可以直接用框架中的工具，把 1558281600000 转换成 2019-5- 20 0:0:0。

日期格式“yyyy-MM-dd”可以使用正则表达式“\\d{4}-\d{\1-\12}-\d{\1-\31}?”来验证。

其中，“\d{4}”代表4位0-9的数字，“\d{\1-\12}”代表数字1-12，“\d{\1-\31}”代表数字1-31。

正则表达式是对字符串（包括普通字符（例如，a 到 z 之间的字母）和特殊字符（称为“元字符”））操作的一种逻辑公式，就是用事先定义好的一些特定字符、及这些特定字符的组合，组成一个“规则字符串”，这个“规则字符串”用来表达对字符串的一种过滤逻辑。

正则表达式是一种文本模式，该模式描述在搜索文本时要匹配的一个或多个字符串。

扩展资料：

常用正则表达式：