python 23：正则表达式中问号的两种用法

2023-02-25 03:22:01Python056

python 23：正则表达式中问号的两种用法,第1张

正则表达式的元字符?，有两种用法。

第一种，表示前面的项是可选项，可有可无，就是匹配零到一次。

第二种，用在花括号后面，表示非贪心匹配。

当？用在花括号后面时，就不是第一种意义。不是表示花括号可有可无，而是表示非贪心匹配。

例1：

以下的正则表达式匹配one和done

例2：

?前面也可以是圆括号界定的项。

例3：

在字符串'HaHaHaHaHa1中，因为(Ha){3,5}可以匹配3个、4个或5个实例，Match对象的group()调用会返回'HaHaHaHaHa'，而不是更短的可能结果。毕竟，'HaHaHa'和'HaHaHaHa'也能够有效地匹配正则表达式(Ha){3,5}。

Python的正则表达式默认是“贪心”的，这表示在有二义的情况下，它们会尽可能匹配最长的字符串。花括号的“非贪心”版本匹配尽可能最短的字符串，即在结束的花括号后跟着一个问号。

在windows下使用非idle的其他ide编辑器，会碰到这个问题。对抓取到的网页内容进行先解码再编码即可。

以requests为例：

r = r.content.decode('gbk').encode('utf-8')

出现编码问题时，

1.仔细分析错误的类型。

看是decode（解码）错误还是encode（转码）错误。

2.搞清自己处理的字符串是什么类型的。

一般看网页的charset，一般为gbk，gb2312或gb18030.其中包含字符的大小为gb2312 <gbk <gb18030。一般出现‘gbk’ codec can’t decode，是因为

（1）要处理的字符串本身不是gbk编码，但是你却以gbk编码去解码

比如，字符串本身是utf-8的，但是你却用gbk去解码utf-8的字符串，所以结果不用说，则必然出错。

（2）处理的字符的确是gbk的，但是其中夹杂的部分特殊字符，是gbk编码中所没有的

如果有些特殊字符是GB18030中有的，但是是gbk中没有的。

则用gbk去解码，去所不支持的字符，也比如会出错。

所以，此种情况，可以尝试用和当前编码（gbk）所兼容的但所包含字符更多的编码（gb18030）去解码，或许就可以了。

3.然后换用这种的字符编码去编码或解码。

详情链接:https://www.crifan.com/summary_python_unicodedecode_error_possible_reasons_and_solutions/

函数，循环，if条件，类定义等后面有block，block要缩进，因此这些语句后面要加上冒号，这是python的语法 python的冒号和java、c中的{}是一样的 block是一组语句

字符串括号字符有的贪心

# 上一篇：R语言求教

# 下一篇：C语言中什么是实型数？

给您推荐相同类型的内容：

如何搭建go语言环境 linux
Go的三种安装方式Go有多种安装方式，你可以选择自己喜欢的。这里我们介绍三种最常见的安装方式：Go源码安装：这是一种标准的软件安装方式。对于经常使用Unix类系统的用户，尤其对于开发者来说，从源码安装可以自己定制。Go标准包安装：Go提供了
常用的生物信息学python库有哪些
常用的生物信息学python库：TkinterPython默认的图形界面接口。Tkinter是一个和Tk接口的Python模块，Tkinter库提供了对Tk API的接口，它属于TclTk的GUI工具组。PyGTK用于python GUI
组件分享之后端组件——基于Go语言的HTML和CSS网站生成器Hugo
近期正在探索前端、后端、系统端各类常用组件与工具，对其一些常见的组件进行再次整理一下，形成标准化组件专题，后续该专题将包含各类语言中的一些常用组件。欢迎大家进行持续关注。本节分享一个基于Go语言的HTML和CSS网站生成器 hugo
压测工具笔记(二)之JMeter
@TOC JMeter是Apache下的一个顶级项目，一个功能强大压力测试工具 JMeter是一个纯java写的开源软件，用来测试可变行为和性能。起初它设计的目的是测试Web应用，但是现在已经扩展到其它的测试 J
如何在 Go 语言中使用 Redis 连接池
一个数据库服务器只拥有有限的资源，并且如果你没有充分使用这些资源，你可以通过使用更多的连接来提高吞吐量。一旦所有的资源都在使用，那么你就不能通过增加更多的连接来提高吞吐量。事实上，吞吐量在连接负载较大时就开始下降了。从上一节的内容可
C语言如何自学？
1、首先需要一本讲解c语言基础知识的书本，按照上面的知识讲解一点点的学习c语言。2、需要在电脑上面安装c语言编译软件，可以选择vc6.0++或者MicrosoftVisualStudio等软件。3、自己编写一些小程序，熟悉编译c语言程序
从Ruby类调用JAR文件问题，怎么解决
例子： java -classpath ".libmail.jar.libskinlf.jar.libMailChecker.jar.libthemepack.zip" com.sample.mailal
java培训班哪家好？
推荐千锋教育，Java应用广泛，除非有一项很大的技术突破能够替代Java。在当下，Java被使用的场景非常多，网站、游戏、办公软件、新零售、云计算、芯片技术、数字经济等多个互联网领域都不开Java，拥有很好的就业前景。就算是小白也可以学会，
Python设计模式：工厂方法模式
工厂，大家一般能想到的是生产产品的地方，在设计模式中，工厂可分为：简单工厂模式、工厂方法模式。在前期推文 Python 简单工厂模式中有关于简单工厂模式的解读。根据工厂的抽象程度可分为：工厂方法模式、抽象工厂模式。
R语言如何把一个plot图的右边加上标签，要求标签字头向外，也就是顺序是从上到下的，如下右侧边框标签？
corners = par("usr") #获取plot区域4个角的坐标点 (x1, x2, y1, y2)text(x = corners[2]-0.2, y = mean(corners[3:4]), "
如何用Python实现微信自动签到功能
题主的签到模式是什么样子的？一般来说分三种：* 给公众号发送特定文字* 普通的网页点击* 授权的网页点击我这里给出前两种的解决方案。普通的网页点击：1. 建议通过浏览器或者Wireshark分析消息的交互。2. 之后通过requests模拟
R语言绘图（ggplot2、ggpubr）从入门到精通04--柱状图美化之调色
本系列课程要求大家有一定的R语言基础，对于完全零基础的同学，建议去听一下师兄的《生信必备技巧之——R语言基础教程》。本课程将从最基本的绘图开始讲解，深入浅出的带大家理解和运用强大而灵活的ggplot2包。内容包括如何利用ggplot2绘制
用 Ruby发邮件
假设您有一个可以工作的 Ruby 应用程序，并且需要向其添加电子邮件传递功能。这可能与用户身份验证或任何其他类型的事务性电子邮件有关，这没有什么区别。本教程旨在帮助您实现使用 Ruby 发送电子邮件。用 Ruby 发送电
如何用xcode写python
使用Xcode写Python文件方法步骤如下：1.找到Python位置：（终端中输入which python）获取python的安装位置，用它来搭建python的编译环境。2.在Xcode中创建python程序打开Xcode，新建项目：Cr
《Discovering Statistics Using R》笔记2-用偏度系数峰度系数考察正态性假设
读《Discovering Statistics Using R》第五章 Exploring assumptions做的笔记。本笔记对应章节为5.5.2，主要介绍使用偏度系数和峰度系数考察正态性假设。上一篇笔记《Discoverin
ruby点击页面弹出框
var DATA='[{"data":{"x":{"precision":2,"subtype":"","type&qu
java培训一般需要多长时间
4-6个月左右。【点击测试我适不适合学设计】挑选java培训班的关键：1、看课程内容，就是看课程中包含哪些内容，是否都是差不多的知识点，是否都包含了企业项目学习内容，一般情况下影响学习周期的主要因素是因为知识内容量和项目内容的多少。2、
回归分析 | R语言 -- 多元线性回归
多元线性回归是简单线性回归的扩展，用于基于多个不同的预测变量（x）预测结果变量（y）。例如，对于三个预测变量（x），y的预测由以下等式表示：y = b0 + b1*x1 + b2*x2 + b3*x3回
小米ruby15.6固态硬盘坏了使用影响性能吗?
会影响性能。有以下2个表现：1、如果只有一块硬盘，硬盘坏了一般电脑能开机但是不能进系统，因为系统是安装在硬盘里面，如果硬盘严重损坏电路短路，电源保护电路动作你电脑都不开机，换好的硬盘重新安装系统电脑正常使用；2、运行速度会变慢，特别是拷贝大
C语言中什么是实型数？
C语言中的实型数据是指带有小数的数。实型数据分两类：单精度和双精度float和double在内存中占用的字节：float占用4个字节，double占用8个字节。整型的变量是没有小数点的，实型是有小数点的整型你可以理解为整数，5:5就是整
R语言循环中数据框的合并，顺序排列
画热图中耽误时间较久的部分https:www.jianshu.compdb53f7463d3f?open_source=weibo_search如下三个数据框创建一个空list，利用get()将所有数据框写入，
R语言作图plot函数以及参数设置解析
plot(x, y = NULL, type = "p",xlim = NULL, ylim = NULL, log = "", main = NULL, sub = NULL, xlab = N
实数集R用区间表示为？
1.使用区间表示下列实数X的集合.(1)0＜X≤1表示为(0,1](2)X≤1表示为(-00,1](-00是负号和一个横着的"8",表示无限小,同理+00就是无限大) (3)X＞a表示为 (a,+00).所谓区间,就是指
R语言怎么样定义一个矩阵
&gtmatrix(1:9,3,3,T) [,1] [,2] [,3][1,]123[2,]456[3,]789 matrix是定义矩阵的函数，1:9表示1-9连续9个数，第一个3表示3行，第二个3表示3列，T表示转置，TRUE的缩
收藏!3个最佳学习Python编程的开源库
SVM既可以用来分类，就是SVC；又可以用来预测，或者成为回归，就是SVR。sklearn中的svm模块中也集成了SVR类。我们也使用一个小例子说明SVR怎么用。X = [[0, 0], [1, 1]] y = [0.5, 1.5] clf
python难还是ruby难
一、异同对比选择1、Python和ruby的相同点：·都强调语法简单，都具有更一般的表达方式。python是缩进，ruby是类basic的表达。都大量减少了符号。·都是动态数据类型。都是有丰富的数据结构。·都具有C语言扩展能力，都具
历险小恐龙的人物介绍
可爱的小脚板姓名：小脚板（Littlefoot）性别；男颜色：棕色眼睛颜色：棕色绰号：可爱的小脚板种族：雷龙性格：几只小恐龙中的主人公，是一只好奇，聪明和敏感雷龙。他对生活态度积极乐观，并且常常鼓励其余的小恐龙。他的友谊超出种类范围。善
mac707和rubywoo区别，mac707为什么有两种颜色
Mac作为现在知名度比较高的口红品牌，到现在已经是拥有数百种口红色号，对于新手或者是使用次数不多的人来说，其实并不能很好的分清楚相关的色号，比如mac707和rubywoo区别，mac707为什么有两种颜色，针对上述问题我们一起来看看相关的
python里的end是什么意思
python里的end是print函数中的参数，为末尾end传递一个字符串，这样print函数不会在字符串末尾添加一个换行符，而是添加一个字符串，其实这也是一个语法要求，表示这个语句没结束。end意思就是以给定字符串或制表符结尾，但是不默认
java就业培训课程哪家好？
Java培训课程一直深受广大学员的青睐，但是很多人却不了解Java到底是什么，java就业培训课程哪家好?下面由北大青鸟嘉荟学校老师http:www.kmbdqn.cn来给大家介绍一下北大青鸟Java培训的主要内容：1、Java初阶：

推荐阅读

热门文章

最新发布

标签列表

python 23：正则表达式中问号的两种用法

给您推荐相同类型的内容：