急求匹配HTML中指定内容的正则表达式

2023-03-02 13:12:01html-css030

急求匹配HTML中指定内容的正则表达式,第1张

用正则实现比较复杂，如果是.net平台的话，可以用平衡组完美实现。

<ul\s+id="list"\s+class="lsits">((((?!<ul\b|</ul>)[\s\S])*(?<open><ul\b[^>]*>))+(((?!<ul\b|</ul>)[\s\S])*(?<-open></ul>))+)*(?(open)(?!))((?!<ul\b|</ul>)[\s\S])*</ul>

解释：

<ul\s+id=""list""\s+class=""lsits""> #匹配开头的ul

((((?!<ul\b|</ul>)[\s\S])* #匹配<ul>和</ul>之间的字符

(?<open><ul\b[^>]*>))+ #匹配到<ul则进栈

(((?!<ul\b|</ul>)[\s\S])* #匹配<ul>和</ul>之间的字符

(?<-open></ul>))+ #匹配到</ul则出栈

)* #匹配可以重复N次

(?(open)(?!)) #判断如果栈不为空，<ul>和</ul>数量不匹配则匹配失败

((?!<ul\b|</ul>)[\s\S])*</ul> #匹配结尾的字符以及</ul>

这个正则式可以正确配对<ul>的，缺点是必须在C#.net VB.net等.net平台上运行。

如果不用.net，那么没有完美的方法。

但是如果你能确定<ul id="list" class="lsits">和</ul>之间有几对嵌套的<ul>

或者如果没有多重嵌套的正则的话，也可以有相应的严格正则。

我先就你上面的文本举个例子：

<ul\s+id="list"\s+class="lsits">[\s\S]*?<ul\b[^>]*>[\s\S]*?</ul>[\s\S]*?</ul>

解释：

<ul\s+id="list"\s+class="lsits">

[\s\S]*?<ul\b[^>]*>

[\s\S]*?</ul>

因为你上面的文本里只嵌套了一个<ul>，所以我就只匹配这个ul，多了不要，问号表示懒惰匹配~

假设我们要获取下面html标签中的内容：

第一段是获取 标签内部的数据，第二个是获取 标签中的数据，其中span标签中有style属性值。

使用过正则表达式的同学肯定知道，上面两种情况其实都是一种情况，我们要获取的是尖括号括起来的一对标签中间的数据，起始标签形如<x>，结束标签形如</x>，这里的x表示的html标签。

此外，我们还需要考虑起始标签中包含style的数据，另外特殊的 标签，对实际获取数据无意义，也需要过滤掉。

通过上面的分析，我们可以如下正则表达式：

在使用正则表达式处理之前，我们先对数据进行预处理，比如style和

标签：

针对多个标签嵌套的情况进行处理，比如 王者荣耀，在经过预处理和正则匹配的后结果是 王者荣耀，需要手工移除掉前面的起始标签，对应的方法如下：

测试方法如下：

output:

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：学习电脑要学些什么软件？

# 下一篇：笔记本电脑键盘延迟

给您推荐相同类型的内容：

怎样让电脑开机变快
问题一：怎么才能让电脑启动的更快?一.一劳永逸法（只要设置一次就可以永久生效） 1.关闭系统还原:右键点击我的电脑-属性-系统还原-关闭所有磁盘上的系统还原(如果之前已建立了还原点,其中System Volume Information
电脑的上网痕迹怎么查
如何查看电脑使用记录。1、有时候，我们为了防止别人运用自己的电脑，会设置好密码这些。但是，有时候电脑一旦没有设置密码的情况下，想知道是否有人运用过我们电脑时，那么我们是可以通过时间段来区分出是否有人去过我们的电脑。那首先，右键点击“我的电脑
华为笔记本如何设置息屏动画
息屏动画就是电脑待机的屏幕保护设置，可去网上下载一些专门制作的屏幕保护程序设置。设置方法如下：1、首先在电脑屏幕空白处点击右键，然后选择个性化。2、接着窗口打开后，点击右下角的屏幕保护。3、其次在新打开的窗目中，点击屏幕保护程序选项的下拉菜
笔记本电脑键盘延迟
问题有几种可能，你可以看一下当时的CPU占用率（在任务管理器中可看到）如果很高，说明你电脑负担太重，是配置低或者是打开窗口太多的原因；卸载不必要的软件，关闭不急用的窗口试试，如果仍不行，则只有升级电脑解决。如果CPU占用率不高，则可能是输入
CSS html5如何做到点击导航栏切换页面
导航栏下面放一个Div，专门用来显示对应导航栏目的内容。点击导航栏触发点击事件，在事件函数中获取点击的栏目id，通过此id确定往div中添加那个内容。可以用div.innerHTML来更新div显示的内容。或者，导航栏下面放置多个Div，数
内存卡在主机的哪个位置，还有，它长啥样？
这是内存条所在的插口, 它分为DDR, DDR2, DDR3. 而这些插口都在主板上, 位于CPU旁边。SSD卡存储卡：1.是用于手机、数码相机、便携式电脑、MP3和其他数码产品上的独立存储介质，一般是卡片的形态，故统称为"
电脑上的 e 是算什么浏览器啊
英文叫Internet Explorer原来叫 Microsoft Internet Explorer和Windows Internet Explorer中文叫互联网浏览器或网页浏览器或互联网网页浏览器可以在上
长时间对着电脑用什么可以防辐射
长时间对着电脑用什么可以防辐射长时间对着电脑用什么可以防辐射，对于很多上班族白领来说,防辐射简直是一件大事了，那么你知道长时间对着电脑用什么可以防辐射吗，下面就跟着我一起来看看吧。长时间对着电脑用什么可以防辐射1第一招：在
电脑开始---运行有哪些有用的代码可以输入
往下看：开始菜单中的“运行”是通向程序的快捷途径，输入特定的命令后，即可快速的打开Windows的大部分程序，熟练的运用它，将给我们的操作带来诸多便捷。 winver 检查Windows版本 wmimgmt.msc 打开Window
怎么实现HTML省市区
由于字数限制,只写了三个省,望采纳&lt!DOCTYPE html&gt &lthead&gt &lttitle&gt 三级联动 &lttitle&gt &
电脑输入法无法切换怎么办
检查下任务栏右下角的输入法指示器是否还在。如果没有，再看看这个输入法图标是否变成活动的了，停在了别的地方。可以按Alt+Shift试试。（有的时候安装或卸载过其它输入法时会导致这样的问题）如果不行，再试试按Ctrl+Space(空格)
我的世界java版登录里的电子邮箱怎么写
首先你要下载和注册一个电子邮箱。你可以下载邮箱大师。邮箱大师下载后可以使用拼音字母注册。也可以使用拼音加阿拉伯数字注册。注册完成后邮箱就可以收发电子邮件了。也可以使用邮箱的账号注册应用软件了。注册的号码就是你的邮箱账号。也是你的邮箱地址。我
组装电脑，配件从哪里买好
组装电脑，配件从哪里买好买配件淘宝天猫价格便宜，但是售后会麻烦，京东自营贵，但是售后很好自己斟酌下咯自己懂的话，本地实体店。为啥，实体店奸商多，最爱蒙骗不懂的买家。网购的话，京东可以。但就是出问题的话，不方便，寄
Python API快餐教程(1) - 字符串查找API
字符串是7种序列类型中的一种。除了序列的操作函数，比如len()来求字符串长度之外，Python还为字符串提供丰富到可以写个编辑器的API. 首先，下面的查找API都是为了查找位置，或者查一共有几次这样的操作。如果只是想判断
电脑上如何查看手机文件？
电脑查看手机文件方法：1、从电脑下载手机小助手，通过手机数据线一头插在手机上一头插在电脑U口相连，这样电脑通过“手机小助手”和你的手机连接，就可以直接打开你手机的文件。2、用电脑登录你的QQ或者微信同时打开同步，将你手机里的文件发送你的QQ
在电脑上怎么做表格步骤
电脑表格制作方法操作如下：1、首先我们需要用到“word”软件来进行制作。【点击下载】2、之后进入word，然后点击左上边的“插入”然后可以根据自己需求来创建表格。3、之后将鼠标移动到表格框线上，之后去拉动鼠标进行行高调整。4、最后可以去选
计算机术语中cpu是指
中央处理器（CPU，英语：CentralProcessingUnitProcessor），是电子计算机的主要设备之一，电脑中的核心配件。其功能主要是解释计算机指令以及处理计算机软件中的数据。电脑中所有操作都由CPU负责读取指令，对指令译码
计算机安全设置
计算机安全设置有如下：操作设备：戴尔笔记本电脑操作系统：win10操作程序：系统和安全2.01、对于计算机的网络安全可以加强和更新计算机中的防火墙来增加相应的系数，点击——控制面板——系统和安全。2、在计算机中的控制面板系统和安全
电脑在天猫下的单咋售后
电脑在天猫下的单售后操作方法：1、点击你具体的天猫订单，然后进入到订单的管理界面，选择进行售后处理就可以了。2、其中包括退换货以及客服评价等。除此之外呢，你还可以让平台的工作人员帮助你来完成售后工作。3、你可以联系平台人员，说清楚你的
细线表格用到的核心 CSS 规则是什么?
可以为表格标签定义宽，高和边框样式，并为单元格单独设置相应的边框。如果只设置table样式，则只显示外边框的样式，内部不显示边框。要想设置相邻单元格边框之间的距离，只能对table标签应用属性。您好！以下是最典型的细线表格，具备最基本的设置
电脑怎么放大或缩小word文字？
操作方法如下：1、电脑打开Word文档。2、打开Word后，选中要放大的文字。3、选中要放大的文字后，同时按住Ctrl+SHift+&gt就可以把文字无限放大，想放多大就可以放多大。4、选中文字按Ctrl+Shift+&lt
初学者怎样学电脑?
问题一：初学者学习电脑该怎样学习？答： 1、楼上各位仁兄回答的都有道理，但是对于初学者学习电脑这点来说，我推荐首先学习操作系统。因为用户在使用电脑，基本都是在使用操作系统。主流操作系统（windows、linux）这两种操作系统都提
电脑视频怎样做成压缩文件？？
可以用电脑自带的压缩软件来制作成压缩文件，以下是具体步骤：1、首先，如图红线所示，选中电脑视频。2、点右键，如图红线所示，选择“添加到压缩文件”。3、如图红线所示，点确定。4、这样，电脑就自动地进行压缩了。5、如图红线所示，这样就制作好了
如何将一个html页面中嵌入另一个html页面
将一个html页面中嵌入另一个html页面步骤如下：1、首先，要嵌入html并不一定要写js代码，如图使用iframe标签，设置其src属性即可。注意其scrolling="auto"以添加滚动条。另外，其width和
电脑下面那个打开的窗口都成重叠的了，请问怎么弄回原来的？
解决方法1、在任务栏上面点击鼠标右键，然后再弹出的菜单中选择“属性”打开任务栏的属性菜单2、点击属性后就打开“任务栏和开始菜单属性”设置查看对话框，如下图所示3、任务栏按钮”后面的状态就是设置任务栏打开的窗口的状态，可以看到当前的状态是
如何不让电脑自动更新
关闭自动更新的方法如下：1.首先要打开任务管理器，使用组合键“Ctrl+alt+Delete”。2.然后点击“任务管理器”。3.然后点击任务栏的“服务”。4.然后点击底端的“打开服务”。5.打开以后，找到“Windows update”并
css 样式的导入的三种方式
1.行内样式行内样式只能影响它所在的标签，而且总会覆盖嵌入样式和链接样式。 &ltp style="font-size: 12pxfont-weight:boldfont-style:italiccolor:red&
微信中的视频怎么传到电脑桌面上？
微信朋友圈中看到有意思的视频或自己录制的小视频想永久保存到电脑桌面上，以备日后播放与欣赏，要如何操作实现，此处介绍一个简单的方法给大家，具体操作如下：一、先在电脑上安装好电脑版微信，手机扫描二维码二、击“登录”按钮，确认登录电脑版微信三、在
电脑的安全模式怎么关闭
win10退出安全模式的步骤：1、打开电脑，同时按下键盘上的【Windows】键和【R】键。2、在弹出的运行菜单中输入“msconfig”。3、然后点击【确定】。4、系统配置“常规”菜单中“诊断启动”即为安全模式。5、点击选择“正常启动
如何将一个html页面中嵌入另一个html页面
将一个html页面中嵌入另一个html页面步骤如下：1、首先，要嵌入html并不一定要写js代码，如图使用iframe标签，设置其src属性即可。注意其scrolling="auto"以添加滚动条。另外，其width和

推荐阅读

热门文章

最新发布

标签列表

急求匹配HTML中指定内容的正则表达式

给您推荐相同类型的内容：