Python基础
Pandas基础
Numpy基础
PySpark基础
数组排序算法
scikit-learn算法小抄
完整版Python科学速查表获取方式:
2. 私信发送“ 资料 ”, 即可获取
(私信方法:点我主页头像旁边的私信按钮,回复“资料”即可)
它们不匹配自己,在正则中具有其它的意义,匹配自己需要转义.
元字符的完整列表:
它们不用来代表字符,用来实现一些特殊的匹配功能
可以给 group() , start() , end() , span() 传入参数 分组的序号 ,以获取模式中特定分组匹配到的内容.默认参数为0.
组从0开始从左到右编号,它始终存在.要确定编号,只需计算从左到右的左括号字符.
(?参数)
(?a:表达式)
(?aiLmsux-imsx:表达式)
(?#注释内容)
(?P<组名>表达式) + result.group('组名') :
(?P<组名>表达式) + (?P=<组名>) :
(?:表达式)
(?=表达式)
(?!表达式)
(?<=表达式)
(?<!表达式)
(?(id/name)yes-pattern|no-pattern)
如果你匹配固定字符串或单个字符类,如果你匹配固定字符串或单个字符类,并且你没有使用任何 re 功能,例如 IGNORECASE 标志,那么正则表达式的全部功能可能不是必需的。 字符串有几种方法可以使用固定字符串执行操作,它们通常要快得多,因为实现是一个针对此目的而优化的单个小 C 循环,而不是大型、更通用的正则表达式引擎。
在转向 re 模块之前,请考虑是否可以使用更快更简单的字符串方法解决问题
正则默认是贪婪模式(匹配为尽可能 少 的文字):
非贪婪:匹配为尽可能少的文字
*? 、 +? 、 ?? 、 {m,n}?
使用正则表达式解析 HTML 或 XML 很痛苦。HTML 和 XML 有特殊情况会破坏明显的正则表达式;当你编写正则表达式处理所有可能的情况时,模式将非常复杂。 使用 HTML 或 XML 解析器模块来执行此类任务 。