C# 正则表达式提取html中的文本

2023-02-19 03:22:02html-css041

C# 正则表达式提取html中的文本,第1张

static void Main(string[] args)

{

String s = @"<Body>

<div>这里是要取出的文本A <img src=""/>这里是要取出的文本B <a href="">超链接里的文本不取出 </a>这里是要取出的文本C </div>

<body>"

Regex regex = new Regex( "(/?\\w+)[^>]*>([^<]*)<", RegexOptions.IgnoreCase )

MatchCollection ms = regex.Matches( s )

foreach( Match m in ms )

{

string tagName = m.Groups[1].Value.ToLower()

string text = m.Groups[2].Value.Trim()

if( tagName != "a" &&text.Length >0 )

Console.WriteLine( text )

}

结果：

这里是要取出的文本A

这里是要取出的文本B

这里是要取出的文本C

请参照以下代码：

public static string FilterHtmlTag(string s)

{

//<...>标记正则表达式

return Regex.Replace(s, @"<[^>]*>", delegate(Match match)

{

string v = match.ToString()

//图片,<p>,<br>正则表达式

Regex rx = new Regex(@"^<(p|br|img.*)>$",

RegexOptions.Compiled | RegexOptions.IgnoreCase)//

if (rx.IsMatch(v))

{

return v//保留图片,<p>,<br>

}

else

{

return ""//过滤掉

}

})

}

你只是声明了正则，未做匹配，假定那个字符串叫str，在你上面代码的下面写

foreach (Match m in No_a.Matches(str2))

Console.WriteLine(m.Groups[1].Value)//每个m.Groups[1].Value就是你要的内容，自己按需要处理

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：使用内嵌式css技术设置p段落为红色字体

# 下一篇：如何在没有编译器的电脑上编写程序？

给您推荐相同类型的内容：

电脑怎样打表格?
如何在电脑上制作简单的表格？步骤：1、打开Excel表格编辑器。2、做出基本框架，选中表格全部。3、右击鼠标，会出现一个表，点击“设置单元格”。4、第四步会出现一个对话框，点击“对齐”选中水平“居中”和垂弧“居中”。
如何在没有编译器的电脑上编写程序？
如果您想在没有编译器的电脑上编写程序，有以下几种方法可供选择：使用在线编辑器：网上有很多在线编辑器，您可以使用这些工具来编写程序。例如，可以使用在线IDE（Integrated Development Environment）工具，比如Co
在网吧上网如何确定电脑没有病毒或木马？
1、如果网吧的系统被挂马的话，木马也在网吧的保护软件保护下，你重启也没用。2、我的做法是这样的：1）在不重要的邮箱里存上一个【进程查看软件】，一个【MD5计算器】。2）开机，先上邮箱，下载【进程查看软件】和【MD5计算器】，把不熟悉的进程（
html页面在ie7中显示没问题,但在高版本 ie中显示有问题,是怎么回事
IE浏览器版本造成的，写HTML代码的人都会遇到这种问题，所以现在程序员们往往会花很多时间来额外解决浏览器的兼容性问题。类似下面的代码都是用于解决某些兼容性问题的：&ltmeta http-equiv="X-UA-Comp
python怎么运行程序。
运行python程序的两种方式是什么？python有两种运行方式：交互式和脚本式。交互式可以通过cmd命令行窗口或者IDEL实现，而脚本式通过写一个脚本（.py结尾的文档）实现。其中交互式主要用于简单的python运行或者测试调试pytho
利用电脑赚钱的副业
利用电脑赚钱的副业利用电脑赚钱的副业，人们的生活压力是越来愈大，很多朋友的工资还完贷款后就没有剩余的，最近很多朋友都说想做副业，但是不知道做什么，下面我就来分享一下利用电脑赚钱的副业，快来看看吧利用电脑赚钱的副业1 做微商
CSS如何将图片叠加到一起？
.wrap li:last-child{ border-right:none}吧最后一个li的border-right的border去掉。。。但是兼容不好，ie好像是ie9以上的浏览器才行~~不行还有一种方法li给border，通过ma
Golang 线程和协程的区别
线程：多线程是为了解决CPU利用率的问题，线程则是为了减少上下文切换时的开销，进程和线程在Linux中没有本质区别，最大的不同就是进程有自己独立的内存空间，而线程是共享内存空间。在进程切换时需要转换内存地址空间，而线程切换没有这个动作，所以
黑客如何入侵别人的电脑。
在这里告诉大家如何入侵别人电脑，从而演绎我们那在别人电脑上无所不能的神话… 首先要确定要入侵电脑的IP，关于IP，网吧的编号和IP地址通常是相同或高一位，比如编号为 20的电脑，IP一般是192.168.0.20或192.168.0.21…
台式电脑内存条怎么装
台式电脑内存条安装方法：1、首先需要先将电脑主机打开，将后盖的两个螺丝取下来，就可以将后盖直接拿掉。2、然后我们需要准备好内存条，内存条需要和电脑的插槽一致，根据自己的主板去买内存，不然别装不上，一般现在都是DDR3的，不过还是要自己看一
电脑的工作原理是什么？
计算机的基本原理是存储程序和程序控制。预先要把指挥计算机如何进行操作的指令序列（称为程序）和原始数据通过输入设备输送到计算机内存贮器中。每一条指令中明确规定了计算机从哪个地址取数，进行什么操作，然后送到什么地址去等步骤。计算机在运行时，先从
如何删除系统自带的软件？
1、卸载软件，一般通过软件的卸载程序即可卸载；如果没有卸载程序例如绿色版、单文件版软件，只要直接删除相关文件文件夹即可。2、有些软件在安装或使用过程中会在系统中生成临时文件或临时文件夹，这些在卸载时可能不会一并删除，另外还有一些dll文件
css的基本语法
css的基本语法 cascading stylesheet(级联样式表)。为网页提供外观（也就是，网页的表现形式）。将网页的外观写在一个css文件里，方便页面代码的维护（将表现与数据分离）。为方便大家学习css，我为大家分享css的基
r语言怎么2017年提取2017
include &ltiostream&gt#include &ltstdio.h&gtint jc(int m){if(m!=1) return m*jc(m-1)else return 1} int c(
高端显卡对电脑配置有要求吗
高端显卡对电脑配置肯定是有要求的。但是假如从游戏性上讲，如果CPU 内存达不到游戏的要求，光有显卡也没用。1、主要看你的主板是否支持独立显卡。2、一块顶级显卡只要接口问和主板相同。3、并且给它配备的电源足够大功率。4、ISA、PCI
笔记本下载什么相机拍照片视频好看
笔记本下载美图秀秀相机拍照片视频好看。电脑拍照在现在的社会中还是比较常见的，比如我们日常中看到的短视频博主，他们基本上用的都是电脑自拍的软件在进行直播，或者一些高级一点的会用到相机，或者是手机之类的，但普遍最多的应该还是电脑，那今天我们就来
苹果手机怎么在锁屏状态下连接电脑？
具体方法如下：用苹果手机正品数据线连接到电脑上的 USB 端口，电脑系统会自动识别出苹果手机的内部存储器。内部存储器包括包括手机上的照片和视频，可以在电脑上把照片或者视频从苹果手机上拷贝到电脑上，如图所示：把 iPhone 与电脑用原配数据
电脑开机黑屏是什么原因？
多方面原因会造成电脑无法启动，具体原因及解决方法如下：1、故障现象：系统完全不能启动，见不到电源指示灯亮，也听不到冷却风扇的声音。解决方案：查看各连线有没接好，有没电源线松动的，如果没有则基本可以认定是电源部分故障。检查：电源线和插座是否有
电脑怎么复制粘贴
在电脑上复制粘贴文字的方法：1、在需要复制的文件上面点鼠标右键，选择复制，进入需要黏贴的路径，在空白处点鼠标右键，选粘帖。2、使用快捷键ctrl＋c复制和ctrl＋v粘帖；选中需要复制的内容，按Ctrl+C；在需要粘贴的地方，按Ctrl+V
如何查看电脑ip地址和默认网关
以WIN10系统为例，电脑的ip地址、默认网关以及子网掩码可以通过进入到该电脑的网络连接属性界面进行填写。打开属性界面以后，选择手动。然后输入正确的编码即可（其中的默认网关与路由器IP地址相同）。具体的输入方法如下：1、在电脑桌面上右键点
电脑如何接蓝牙音箱
问题一：台式机蓝牙音箱要怎么连接台式机连接蓝牙音箱方法一首先看看电脑有没有蓝牙功能模块,如果没有,需要另外购买一个蓝牙模块,一般都有USB接口,大小和U盘差不多,如果想要支持距离远一些,可以买大功率的,有带有天线的,市场种类好多,
在jsp中怎样加入css样式
在jsp中加入css样式，就跟html加入的方式一样，具体有以下三种方式：1、外部样式当样式需要应用于很多页面时，外部样式表将是理想的选择。在使用外部样式表的情况下，你可以通过改变一个文件来改变整个站点的外观。每个页面使用&ltl
怎么检测电脑硬盘
可以借助软件检测电脑硬盘，下载软件鲁大师找到磁盘检测，点击&ltSMART信息&gt，就可以看到硬盘更加详细的信息和数据。详细步骤：1、网上下载并安装一款名叫鲁大师的系统工具软件。2、在软件的主页面中，找到右下角的&am
CSS设置链接的样式
链接是从一个网页到另一个网页的连接，CSS可通过不同属性以各种不同方式来设置链接的样式。下面本篇文章就来给大家介绍一下CSS设置链接的样式的方法，希望对大家有所帮助。在讨论CSS属性之前，先了解链接的状态是非常重要的。链接可以存在于不
笔记本中所谓的小黑是什么牌子或者机型？
笔记本中,所谓的小黑,一般是指THINKPAD品牌X系列.“小黑”，是国内众多ThinkPad笔记本电脑发烧友和用家对ThinkPad的昵称.小黑是指它外观的经典颜色都是黑色的，以黑色为主,基本都是黑色外壳,所以叫它小黑.小黑原来是I
组装电脑哪个牌子好
问题一：组装电脑和品牌电脑哪个好目前所有的品牌机都是组装机,只不过品牌机是大批量采购组装后经过测试,印上自己的品牌. 1. 稳定性方面:品牌机的配件采用大批量采购的方式,有自己独立的组装车间和测试车间,有自己的品牌理念.自己组装机需
电脑上的照片怎么缩小？
准备工具：电脑，wps看图软件1.打开电脑，在桌面中找到需要修改的图片，右键点击该图片进入到功能页面中。2.在功能页面中找到打开方式选项，点击该选项进入到打开方式页面中。3.在打开方式页面中找到WPS图片选项，点击该选项进入到图片查看页面
适合打游戏的高性能台式机有哪些推荐？
打游戏的高性能台式机毫无疑问肯定是ALIENWARE AURORA R14！它实在是惊艳到我了！当初买它只是为了打打吃鸡，现在发现用它做什么都行！大型建模都可以还用怀疑它的高性能吗？这款电脑在之前的基础上，这款台式机进行了升格「预言」2.0
组装电脑什么配件最重要？
组装电脑的主要配件有以下几个：CPU，显卡，主板，内存，硬盘，电源。一、CPU的英文全称是"Central Processor Unit"，翻译成中文就是“中央处理器单元”，它一条一条镀金的材料做的。它在PC机中的作用
电脑很卡怎么回事？
双击“我的电脑”——右键点C盘——点“属性”——点“磁盘清理”——点“确定”——再点“是”——再点“确定”。清理过程中，您可看得到未经您许可(您可点“查看文件”看，就知道了)进来的“临时文件”被清除了，盘的空间多了。对D，E，F盘也要用这法

推荐阅读

热门文章

最新发布

标签列表

C# 正则表达式提取html中的文本

给您推荐相同类型的内容：