正则表达式匹配html标签，获取标签内容

2023-03-01 22:16:02html-css021

正则表达式匹配html标签，获取标签内容,第1张

假设我们要获取下面html标签中的内容：

第一段是获取 <p></p>标签内部的数据，第二个是获取 <p><span></span></p>标签中的数据，其中span标签中有style属性值。

使用过正则表达式的同学肯定知道，上面两种情况其实都是一种情况，我们要获取的是尖括号括起来的一对标签中间的数据，起始标签形如<x>，结束标签形如</x>，这里的x表示的html标签。

此外，我们还需要考虑起始标签中包含style的数据，另外特殊的 <br/>标签，对实际获取数据无意义，也需要过滤掉。

通过上面的分析，我们可以如下正则表达式：

在使用正则表达式处理之前，我们先对数据进行预处理，比如style和

标签：

针对多个标签嵌套的情况进行处理，比如 <p><span style="white-space: normal">王者荣耀</span></p>，在经过预处理和正则匹配的后结果是 <span>王者荣耀，需要手工移除掉前面的起始标签，对应的方法如下：

测试方法如下：

output:

(?<=>)[^<>]+(?=<)

假如html标签里面有一句：

String a = "<style type=\"text/css\">div \n" +

"{ margin: 0padding: 0outline: 0}</style>"

我如何把这一句取出来呢，包括标签。

用正则表达式：<style([\\s\\S]*)</style>

扩展资料：

正则表达式匹配HTML标签

方法一：

var str = '<p class="odd" id="odd">123</p>'

var pattern = /<\/?[a-zA-Z]+(\s+[a-zA-Z]+=".*")*>/g

console.log(str.match(pattern))

方法二：

var str = '<p class="odd" id="odd">123</p>'

var pattern = /<[^>]+>/g

console.log(str.match(pattern))

方法三：

var str = '<input type="text" value=">" name="username" />'

var pattern = /<(?:[^"'>]|"[^"]*"|'[^']*')*>/g

console.log(str.match(pattern))

说明：()表示捕获分组，()会把每个分组里的匹配的值保存起来，使用$n(n是一个数字，表示第n个捕获组的内容)

(?:)表示非捕获分组，和捕获分组唯一的区别在于，非捕获分组匹配的值不会保存起来

没有引用的需求的话，采用非捕获性分组，更为简洁；

方法四：

var str = '<input type="text" value=">" name="username" />'

var pattern = /<(?:[^"'>]|(["'])[^"']*\1)*>/g

console.log(str.match(pattern))

</script>

<(a[^>]+(?=[ >])|[^a][^>]*(?=[ >]))[^>]*>([^<]*)text([^<]*)</(a[^>]+(?=[ >])|[^a][^>]*(?=[ >]))[^>]*>

可以匹配举例：

<abbr>

<base>

<p>

不能匹配举例：

<a>

即，如果标记是以a开头但不仅仅是<a>的的标记就可以匹配，比如<abbr><address>，但<a>就不能匹配。不是以a开头但标记中有a的也可以匹配。当然，你要求的其他情况也满足。

是麻烦了一点，或许还有简单一点的式子，不过这个可以用。你的语法好像要在<>前加\，自己加吧！有错误或想要解释的话，用百度的短消息功能联系我。

原创首发………………

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：台式电脑用什么声卡好?

# 下一篇：迷你组装电脑和普通电脑有什么区别？

给您推荐相同类型的内容：

电脑任务栏不见了如何恢复
电脑任务栏不见了，恢复的方法如下：因为电脑桌面下方的任务栏已经不见了，连带着左下角的开始菜单也消失了，此时无法直接使用鼠标打开开始菜单，需要在键盘上找到Win键，按下Win键以后，桌面左下角会自动弹出一个菜单，找到齿轮图标，点击进入设置。
JS常见排序算法
排序算法说明:（1）对于评述算法优劣术语的说明稳定：如果a原本在b前面，而a=b，排序之后a仍然在b的前面；不稳定：如果a原本在b的前面，而a=b，排序之后a可能会出现在b的后面；内排序：所有排序操作
现在的笔记本电脑安装什么系统好?
现在的笔记本电脑安装Windows7系统好，Windows7是微软公司推出的电脑操作系统，供个人、家庭及商业使用，一般安装于笔记本电脑、平板电脑、多媒体中心等。微软首席运行官史蒂夫·鲍尔默曾经在2008年10月说过，Windows 7是W
电脑包什么牌子的最好
1、泰格斯泰格斯（Targus)是公认的在移动产品领域居于领先地位的供应商。自1983年成立至今，泰格斯（Targus)始终致力于为移动产品的便携包及配件设备建立一套完善的、面向保护、工艺以及功能方面的严格标准。2、森泰斯SUMDEX
哪个快递公司可以邮寄笔记本电脑
几乎所有的快递公司都可以邮寄笔记本电脑的。例如：EMS、申通、顺丰、韵达、中通，圆通都可以邮寄笔记本电脑。在邮寄笔记本的时候，记得要先用一块海绵垫好笔记本，防止震荡弄坏屏幕，再在外面包一层泡沫，在在箱子里装一层泡沫，层层保护，再去邮寄，
如何在电脑上注册QQ账号？
具体操作步骤如下：一、首先需要在电脑上安装QQ客户端，双击打开，进入登陆界面，然后点击右侧的注册帐号。iknow-pic.cdn.bcebos.comcc11728b4710b9128427ad6acdfdfc03934522bb&qu
怎么把微信上的文件传到电脑上
在电脑上使用网页微信，通过文件传输助手，可以互传文件。步骤：1、打开浏览器，打开微信网页版。2、点击微信网页版官网。使用手机微信扫码登录。3、使用手机微信扫一扫，扫码。4、手机点击登录，同意网页版微信登录。5、网页版微信登陆后，出现文件
win7系统如何设置ip
工具材料电脑方法如下1、首先打开电脑，点击右下角网络的图标，在里面找到“大阿奎i网络和共享中心”选项。2、接着点击“更改适配器设置”选项。3、进入页面找到“本地连接”选项，单击鼠标右键。4、接着按照下图中提示依次点击。5、点击右下角
迷你组装电脑和普通电脑有什么区别？
迷你，就是小型，小尺寸，机箱、主板及一些配件都是小型特制的，与普通电脑不兼容，价格也会更贵，组装电脑首先来说就是价格便宜性价比高。x0dx0a 其次可以挑选自己喜欢的硬件这样可以保证电脑整体的性能像那些品牌机多半都是好处理器烂显
什么笔记本比较好 2017五款性能色出的轻薄笔记本推荐
笔记本是我们生活办公与娱乐休闲的的重要设备，它可以让我们的生活丰富多彩。现在本最受大家的喜爱是那些性能强悍，外观出众的笔记本，字市场上具有很不错的销量，那么目前什么笔记本比较好，下面就给大家推荐2017五款性能色出的轻薄笔记本吧。
清华同方电脑好不好
第一，清华同方笔记本采用的是非常经典的LINUX操作系统以及VIA C3 1.0G的处理器，这套配置使得电脑的操作流畅性大大的提高。第二，清华同方笔记本采用的是1024×768分辨率的12.1英寸的屏幕，而且主板内置AC97芯片的音频系统，
HTML之marquee标签（滚动字幕（跑马灯））
marquee标签并不是W3C官方推荐的标签，但是这个标签在各个浏览器中都非常支持。 ① 默认情况下，在标签中输入的文字是从右向左滚动的。但是可以通过marquee标签的属性direction来控制滚动的方向。 direction=
十大计算机培训学校
以下排名仅供参考：1、北大青鸟：北大青鸟IT教育成立于1999年，致力于培养中国IT技能紧缺型实用人才，是我国最大的IT职业教育机构。公司长期专注于中国IT职业教育领域，依托北京大学雄厚的教育资源，通过院校合作和特许加盟两大经营模式以及先
电脑废旧的散热风扇可以做什么
可以废物利用。1、把针口剪掉，红黑蓝三条线，把红线和黑线的线头剥出来，蓝线可以不用管。2、这时要用到另一个道具了，桶装薯片，用剪刀剪掉一小节罐底，如图。3、用剪刀把桶头剪成这样。因为桶口尺寸跟风扇大小不吻合，需要加工一下。4、调整好大小，把
电脑黑屏按哪三个键恢复？
1、如果电脑黑屏，一般情况下可以按Ctrl+Alt+Delete三个键重启电脑；2、按Fn+F2是切换黑屏和恢复正常的组合键；3、打开电脑后，显示系统界面后出现黑屏。很可能存在软件或驱动程序冲突。开机后可以按F8进入安全模式，然后开机调整。
电脑风扇520轴承什么牌子的质量好？
散热风扇的滚珠轴承品牌我知道的有三家，日本有两家做的不错，一家是ISC，一家是NMB，国内也有一家叫山口精工，前两家散热风扇工厂用的多一些，微型风扇工厂深圳敬阳达电子有限公司也是这两家的，有关规格一般是以下三种：520滚珠（外径是52mmu
求推荐html到css到js相关的书籍
第一本，入门《Head first HTML&ampCSS》最好的入门书。看两遍就对HTML &ampCSS 有个大概印象了。此时把w3cschool作为备查手册收藏起来第二本《CSS权威指南（第三版）》最权威的CS
两台电脑如何建立局域网共享
两台电脑建立局域网共享的方法：品牌型号：华硕系统版本：UX30K723A软件版本：win71，右键点击需要共享的文件夹或文件，选择“属性”。2，点击“共享”，打开“网络和共享中心”。3，启用如图共享的三个设置。4，关闭密码保护，点击
请问各位高手一个关于利用css使ie实现渐变效果的问题
CSS3渐变渐变.html 文件代码清单如下：&lt!doctype html&gt&lthtml lang="zh"&gt &lthead&gt
电脑为什么下载不了软件呢？
1、用户的权限问题。只有管理员才有权限去安装或者删除软件，而一般用户，也就是user权限是不能对软件安装和删除的。2、服务出错。检查WindowsInstaller服务是否正常，如果不正常，重新下载安装。3、启动项出问题。检查电脑的启动项，
使用Chart.js绘图怎么才能把图例给显示出来
C# code? var myChart = new Chart(ctx).Pie(data, options) var legend = myChart.generateLegend()legend 里就是模板生成的HTML代码，可以设置
电脑算命是不是新事物
我不知道你问的这个问题的具体含义，也可以说是新事务也可以说不是：1，电脑算命是有了计算机之后才有的，与过去相比算是新事务2，电脑算命从计算机初步普及不多久，就有了相关的软件，也有10来年了，与现在相比不能说是新事务了3，表面形式上是一种新的
维修费开票属于什么类
维修费属于劳务中的修理修配劳务。是高级技工或者有维修资质的单位在为客户提供维修服务是收取的费用叫做维修费。维修费有很多种科目，比如电脑维修费，空调维修费，任何东西在损坏的时候需要维修的时候所产生的费用都可以称之为维修费。一般纳税人增值税税率
自己怎样为电脑重装系统？
使用U盘下载电脑系统文件，进行解压安装，完成电脑系统的安装，具体如下：1、将下载完的电脑系统iso文件下载到C盘之外的分区，比如下载到F盘，右键使用WinRAR等工具解压到当前文件夹或指定文件夹，不能解压到C盘和桌面，否则无法重装。2、弹
电脑刺绣属于什么行业
青岛电脑刺绣机总厂是中国生产缝制设备的大型骨干企业，主要生产“鹰轮牌”多头电脑刺绣机。该产品广泛应用于刺绣、抽纱、服装、针纺织品、皮革、鞋帽等行业，是具有现代国际水平的机电一体化高科技产品。我厂产品曾先后获得国家科技进步二等奖，国家“八五”
电脑无法正常启动怎么办
电脑无法正常启动的解决方法：1、按Ctrl+Alt+Del组合键，重新启动电脑如果电脑处于正在启动界面超过5分钟，那么这个时候多半是无法正常启动了，也就是我们所说的卡在了启动界面上。遇到这种情况，第一个方法，也是最直白的方法，就是重启
苹果账号在哪登陆 Apple ID怎么在电脑登录
工具原料：QQ浏览器。1、首先点击电脑桌面中的QQ浏览器。2、在百度搜索引擎中输入apple官网并点击百度一下。3、点击apple官方网站。4、点击管理你的apple id。5、输入apple id并点击回车键。6、输入apple id
电脑屏幕锁定的快捷键是什么？
电脑屏幕锁定的快捷键是WIN键+L键，如图所示，按住WIN键不放，再按L键即可立即锁定电脑。大多数情况下，锁屏要与锁屏密码相配合使用，在锁屏之后，只有当用户输入了正确的密码才可以重新进入系统，从而起到了保护系统安全的作用。锁屏密码可以通过
如何从html代码中获取纯文本
有以下两种方法：假设为如下文本框：1&ltinput type="text" value="" id="text"&gt1、原生JS获取文本框的值：1documen
网页中通过js修改img的src属性刷新图片
业务：采购业务流程中当财务人员打款后需要将打款流水图片上传到ftp服务器上。可是有时会上传出错。所以这里需要一个修改的图片的按钮。问题：当img的src的URL地址与之前相同（只更改图片，名称不变，不同图片相同名称）时，结果图片不变化，还是

推荐阅读

热门文章

最新发布

标签列表

正则表达式匹配html标签，获取标签内容

给您推荐相同类型的内容：