如何用正则表达式去掉html标签

2023-03-01 19:38:02html-css045

如何用正则表达式去掉html标签,第1张

用正则表达式去掉html标签，下面是它的代码，直接复制就可以用的。

代码：

public

static string StripHTML(string HTML) //google "StripHTML" 得到 {

string[] Regexs = {

@"<script[^>]*?>.*?</script>",

@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",

@"([\r\n])[\s]+", @"&(quot|#34)",

@"&(amp|#38)", @"&(lt|#60)",

@"&(gt|#62)", @"&(nbsp|#160)",

@"&(iexcl|#161)",

@"&(cent|#162)",

@"&(pound|#163)",

@"&(copy|#169)", @"(\d+)",

@"-->", @"<!--.*\n" }string[]

Replaces = { "", "", "", "\"", "&",

"<", ">", " ", "\xa1", //chr(161),

"\xa2", //chr(162), "\xa3", //chr(163), "\xa9", //chr(169), "",

"\r\n", "" }string s = HTMLfor (int i = 0i <

Regexs.Lengthi++) { s = new Regex(Regexs[i],

RegexOptions.Multiline | RegexOptions.IgnoreCase).Replace(s,

Replaces[i])} s.Replace("<", "")

s.Replace(">", "")s.Replace("\r\n", "")return s

} }

假设我们要获取下面html标签中的内容：

第一段是获取 <p></p>标签内部的数据，第二个是获取 <p><span></span></p>标签中的数据，其中span标签中有style属性值。

使用过正则表达式的同学肯定知道，上面两种情况其实都是一种情况，我们要获取的是尖括号括起来的一对标签中间的数据，起始标签形如<x>，结束标签形如</x>，这里的x表示的html标签。

此外，我们还需要考虑起始标签中包含style的数据，另外特殊的 <br/>标签，对实际获取数据无意义，也需要过滤掉。

通过上面的分析，我们可以如下正则表达式：

在使用正则表达式处理之前，我们先对数据进行预处理，比如style和

标签：

针对多个标签嵌套的情况进行处理，比如 <p><span style="white-space: normal">王者荣耀</span></p>，在经过预处理和正则匹配的后结果是 <span>王者荣耀，需要手工移除掉前面的起始标签，对应的方法如下：

测试方法如下：

output:

1、过滤所有html标签的属性的正则表达式：

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 JavaScript

"'<[\/\!]*?[^<>]*?>'si", // 去掉 HTML 标记

"'([\r\n])[\s]+'",// 去掉空白字符

"'&(quot|#34)'i",// 替换 HTML 实体

"'&(amp|#38)'i",

"'&(lt|#60)'i",

"'&(gt|#62)'i",

"'&(nbsp|#160)'i"

) // 作为 PHP 代码运行

$replace = array ("","","\\1","\"","&","<",">"," ")

$html = preg_replace($search, $replace, $html)

顶

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：微信小程序能开发什么语言呢？

# 下一篇：现在台式电脑什么牌子的比较好

给您推荐相同类型的内容：

怎么看苹果电脑是固态硬盘?
查看苹果电脑的硬盘方法：点击苹果图标—点击关于本机—点击储存空间后即可看到硬盘的详细信息，具体操作步骤如下：1、打开苹果电脑，找到左上角的苹果图标，点击苹果图标2、点击左上角的苹果图标后在出现的下拉菜单中点击关于本机。3、打开关于本机后默
用什么软件查看电脑配置。
可以直接在电脑自带的软件中查看电脑配置。查看配置方法：1、以win7系统为例，首先点击桌面左下角的开始按钮，在打开的菜单中选择“附件”。2、然后在打开的“附件”菜单中点击“系统工具”选项。3、打开后，找到“系统信息”选项，点击进入该选项
怎么把电脑内存变大?
问题一：电脑内存太小怎么办，如何让内存变大啊1、购买内存加进去，现在内存很便宜，这是最有效的方法 2、增加电脑分页文件功用硬盘来虚拟内存。操作：右击我的电脑--》属性--》高级--》性能--》设置--》高级，这里可以设置虚拟内存。
如何更换电脑主板电池
1、找到主板上CMOS电池的位置，外观如下图2、CMOS电池座上有一个固定电池的卡榫3、您可以用螺丝起子压下卡榫4、卡榫松开后电池会自动弹起5、再将电池取下，换上新的电池即可主板电池是为计算机的主板芯片供电的一个纽扣电池，保证计算机在关机的
女孩学电脑什么专业前景好？
一，计算机科学与技术专业这个专业是计算机大类专业中最热门的之一，也是社会中人才需求量最大的专业，是计算机专业中就业面最广，而且就业前景最好的专业，对于想要做程序员工作的女生来说是不错的选择。二，网络与新媒体专业5G时代已经来临，信息传播的速
电脑音箱什么牌子最好
问题一：电脑音箱哪个牌子比较好电脑音箱，又称为多媒体有源音箱，有多种形式。按声道分，有2.0声道对箱、2.1声道低音炮等，1.0单声道音箱以及5.1声道低音炮较少用于电脑。按供电模式分，有220V交流供电，USB供电，锂离子充电电池供电
压缩后的JS代码怎样解压缩？
一般压缩都经过混淆，如果你看到变量名都是A,B,C,D之类的无规则的命名，那就是被混淆过的，一般来说也很难阅读，就算你还原了格式。如果是没有混淆的，你可以试试用js的格式化工具来重新格式化一下的，比如： * 美化：格式化代码，使之
解析2015java软件开发发展前景| 有时候选择比选择更重要
找个好的工作，拿着可观的薪水，过着都市白领的乐活生活，是每个年轻人的希望。但是，纵观现在的求职市场，应届大学生在毕业时能够顺利找到工作已经实属不易，找个地位高、待遇高、前途好、当白领的工作更是难上加难。还有的在职者，混迹多年，却依然停留在城
英雄联盟快捷键有哪些
A：攻击S：停止当前动作H：原地待命ESC：打开游戏菜单Enter 发送聊天信息（默认:只发送给队友）SHIFT Enter 或all发送给所有人help命令列表说明surrender开始投降投票或在别人发起投票后同意投降nosu
Win7局域网文件共享怎么设访问密码？
1、首先进入电脑桌面，右键单击“我的电脑”--选择“管理”选项。2、在“管理”界面，依次展开--“本地用户和组”--“用户”。3、接着在用户界面空白处单击鼠标右键--新建一个我们用来设置账户和密码的“新用户”。4、这里我们设置用户名为“ba
主板南北桥坏了会有什么现象
主板的南北桥坏了可能会造成系统无法正常开机和死机的现象。主板中南桥负责的是速度较低的设备如硬盘、USB、集成声卡、 PCI设备。如果南桥出现故障，开机第一道程序BIOS自检就过不去就没法正常开机的现象。北桥是负责联系CPU、内存和显卡
ipad怎么安装软件?
可以使用兼容苹果系统的第三方软件，将下载的ipad软件安装上。例如：itools。步骤：1、电脑上安装itools，运行后，将ipad连接电脑上。2、点击左侧”应用“，右侧出现ipad上现有应用列表。3、点击“安装”，在“打开”窗口中，
电脑如何正确开关机
要使用电脑必须启动它，要停用电脑的时候必须要关闭，电脑如何正确开关机呢？下面是我分享的经验，一起来看一下吧。电脑开机正确步骤1、先把总电源打开。就是接通主机与显示器的总电源。一般是一个插排，打开插排的开关。 2
电脑光驱有什么用?
电脑光驱有什么作用？电脑光驱的作用：你有了光驱：1.可以放任何DVD有关的碟片和软件或其它媒体或档案资料2.假如你系统坏了，自己又不会用U盘PE系统，那你就得要用到光驱来安装系统了！3.有光驱带刻灵的那种，你还可以把你重要的资料全部写
回老家流量不够用，换一个电信的流量卡，包含哪些东西？
你好！电信的星卡59档，包含30G国内定向流量和20G国内流量。定向流量可用于百度系、网易系、头条系、腾讯视频、优酷视频、爱奇艺、快手、易信、阿里云、阿里巴巴、书旗小说、高德地图、手淘天猫、央视频。不同地区的套餐详情可能略有出处，请以地方营
双核cpu装什么系统好
中央处理器(CentralProcessingUnit)的缩写,即CPU,CPU是电脑中的核心配件,只有火柴盒那么大,几十张纸那么厚,但它却是一台计算机的运算核心和控制核心。下面是我带来的关于双核cpu装什么系统好的内容，欢迎阅读!
在HTML 中怎么引用外部文件夹里的HTML呢？
在html中可以采用iframe的方式引入外部html文件。iframe 元素会创建包含另外一个文档的内联框架（即行内框架）。如下这个示例：&lthtml&gt&ltbody&gt&ltiframe
学完python可以干什么？
综述如下：1、数据分析现在无论是哪个行业的，做数据分析的人似乎都离不开Python，因为Python给他们带来的工作效率是非常的大。2、自动化测试一切关于自动化的东西，似乎Python都可以满足，Python可以满足大多数自动化工作，
现在台式电脑什么牌子的比较好
比较好的台式电脑品牌推荐：宏_、联想电脑、华硕电脑、ThinkPad电脑、戴尔电脑。一、宏_宏_以性价比优势在2011年销量占据全球第2名，它是欧洲销量冠军！同样配置下比华硕便宜500，但同时质量比华硕差些，而且华硕老总也是从宏基走出去
电脑如何通过网络装系统？
1、先连接好服务器与客户机的网线，通过交换机或用交叉线直接联都可以，设置好服务器端的IP地址，比如我设置的是192.168.0.72、压缩包，解压后应该有四个文件：Tftp32.exe、GhostSrv8.2.exe、autonetghos
css3 - css中如何让第一个和最后一个不被选中?
方法很多种，例如通过伪类：last-child{ 样式 }这个是选择最后一个父级子元素。第一个父级子元素可以这样nth-child(1){ 样式 }除了上面的方法还可以通过给第一和最后一个元素设置一个额外的类来设置样式。首先要更正一下，不存
css3的选择器有哪些？
css3选择器如下：一、通配符选择器（*）通配符选择器是用来选择所有元素，，也可以选择某个元素下的所有元素。二、元素选择器（E）元素选择器，是css选择器中最常见而且最基本的选择器。三、类选择器（.className）类选择器是
电脑cpu风扇转速太高如何让它降下来
1、进入控制面板2、选择系统和安全3、选择电源选项4、选择高性能，然后点击选择更改计划设置5、选择高级电源设置6、选择高性能，然后选择子选项拓展开来可以进行详细的设置。7、散热方式分为主动和被动，主动模式是指转速一直保持在一个相对较高的转速
精通HTML5+CSS3需要学什么？
精通HTML5+CSS3需要学什么？主要学习vscode编辑器基本使用、HTML5新增标签、CSS3新增选择器及案例、2D转换及相关案例实现、3D转换和旋转木马案例等知识点。一、vscode编辑器基本使用vscode 基本使用vscod
压缩后的JS代码怎样解压缩？
一般压缩都经过混淆，如果你看到变量名都是A,B,C,D之类的无规则的命名，那就是被混淆过的，一般来说也很难阅读，就算你还原了格式。如果是没有混淆的，你可以试试用js的格式化工具来重新格式化一下的，比如： * 美化：格式化代码，使之
CSS文字垂直居中
01先写上html代码，如图，内容很简单，就是一个div里有一段文本。02再写上div对应的样式，如图，这里只设置了div的边框和高度，宽度。03如果这里显示的话，我们看下页面，文本是不会水平居中和垂直居中的。04
电脑彻底删除的文件如何恢复
很多人会不小心，将一些重要的文件资料也删除。那么，当重要的文件资料被删除后，我们又有什么方法可以将其恢复和找回呢？下面小编就为朋友们简单介绍下常用的恢复被删除文件的方法吧。彻底删除的文件怎么恢复操作步骤：第一步：下载并安装失易得数据恢复
HTML 延迟加载显示
HTML 延迟加载显示&ltdiv id="vodid1"&gt第一个按钮直接显示&ltdiv&gt&ltinput type="submit" va
css实现文字两端对齐
但问题是，我怎么就看不到效果呢？无论是英文还是中文，在IE和chrome下都不起作用。后来，终于在StackOverflow上找到解决方法了。从效果图可以看到，除了要在块级元素加text-align:justify样式外，还需要在里
怎么取消电脑锁屏密码
电脑锁屏密码怎么取消，下面是操作方法。1、首先打开电脑左下角的开始，点击设置。2、然后在弹出窗口中选择账户打开。3、接着在打开的账户窗口中，点击左栏登录选项。4、然后在打开的右边栏中，点击Windows Hello PIN。5、在弹出框中

推荐阅读

热门文章

最新发布

标签列表

如何用正则表达式去掉html标签

给您推荐相同类型的内容：