C# 正则表达式提取html中的文本

2023-03-03 20:58:02html-css022

C# 正则表达式提取html中的文本,第1张

static void Main(string[] args)

{

String s = @"<Body>

<div>这里是要取出的文本A <img src=""/>这里是要取出的文本B <a href="">超链接里的文本不取出 </a>这里是要取出的文本C </div>

<body>"

Regex regex = new Regex( "(/?\\w+)[^>]*>([^<]*)<", RegexOptions.IgnoreCase )

MatchCollection ms = regex.Matches( s )

foreach( Match m in ms )

{

string tagName = m.Groups[1].Value.ToLower()

string text = m.Groups[2].Value.Trim()

if( tagName != "a" &&text.Length >0 )

Console.WriteLine( text )

}

结果：

这里是要取出的文本A

这里是要取出的文本B

这里是要取出的文本C

(?<=>)[^<>]+(?=<)

假如html标签里面有一句：

String a = "<style type=\"text/css\">div \n" +

"{ margin: 0padding: 0outline: 0}</style>"

我如何把这一句取出来呢，包括标签。

用正则表达式：<style([\\s\\S]*)</style>

扩展资料：

正则表达式匹配HTML标签

方法一：

var str = '<p class="odd" id="odd">123</p>'

var pattern = /<\/?[a-zA-Z]+(\s+[a-zA-Z]+=".*")*>/g

console.log(str.match(pattern))

方法二：

var str = '<p class="odd" id="odd">123</p>'

var pattern = /<[^>]+>/g

console.log(str.match(pattern))

方法三：

var str = '<input type="text" value=">" name="username" />'

var pattern = /<(?:[^"'>]|"[^"]*"|'[^']*')*>/g

console.log(str.match(pattern))

说明：()表示捕获分组，()会把每个分组里的匹配的值保存起来，使用$n(n是一个数字，表示第n个捕获组的内容)

(?:)表示非捕获分组，和捕获分组唯一的区别在于，非捕获分组匹配的值不会保存起来

没有引用的需求的话，采用非捕获性分组，更为简洁；

方法四：

var str = '<input type="text" value=">" name="username" />'

var pattern = /<(?:[^"'>]|(["'])[^"']*\1)*>/g

console.log(str.match(pattern))

</script>

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：新人求教怎么才能骗到js

# 下一篇：电脑怎么更改文件权限？

给您推荐相同类型的内容：

python使用telnetlib库使用write（）函数无法发送命令
我在Win XP上，执行楼主的代码，可以的，没有任何问题的；所以我怀疑： t.write(commands + 'n') #命令无法执行--------对应的Commands，不是routeros软路由的有效命令，或者
电脑锁屏密码设置在哪里？
首次进入系统时，可根据界面提示设置开机密码。若您当时未设置开机密码，您可以按照以下操作管理：1.点击桌面 Windows 图标 &gt设置图标，选择帐户。2.点击登录选项，在密码栏下点击添加，然后根据界面提示添加新的开机密码。鼠标
电脑桌面点不动但鼠标能动
电脑桌面点不动，但鼠标能动，原因如下：1、鼠标能动，但点击桌面没反应。2、其实出现这种原因是因为explorer程序没响应了，要解决这个问题，除了强行关机或重启电脑，还有其它办法的。3、同时按下键盘的ctrl+alt+del键，来打开任务管
电脑字体如何安装？
第一步：从网站上下载您需要的字体，第二步：打开文件夹，选中并复制需要安装的字体软件第三步：打开我的电脑，选择C盘，打开WINDOWS文件夹，找到FONTS文件夹第四步：将已经复印的字体粘贴在文件夹中，第五步：关闭文件夹，打开WORD，就可以
无线手柄怎么连接电脑
插入蓝牙接收器，安装蓝牙手柄驱动，连接手柄。蓝牙（Bluetooth）是一种无线数据和语音通信开放的全球规范，它是基于低成本的近距离无线连接，为固定和移动设备建立通信环境的一种特殊的近距离无线技术连接。蓝牙使一些便携移动设备和计算机设备能够
电脑加减乘除怎么输入
电脑加减乘除输入方法如下：首先打开电脑上，选择任意一个word文档软件将其打开，然后找到下方的输入法使用鼠标进行右击，选择选项栏中的软键盘，再选择其中的数学符号键盘，找到其中的加减乘除符号并点击就可以输入了。或者电脑键盘加号打法：1、按住S
怎么查看电脑牌子和型号
方法一：可通过机身背面或侧面上的标签查看计算机的型号。方法二：1.按下“Win + R”组合键，输入“dxdiag”后回车。2.选择“系统”选项卡，查看计算机的型号。方法三：1.按下“Win + R”组合键，输入“cmd”后回车。2.输入“
电脑下载软件有哪些比较好的应用市场类的软件？
电脑下应用可以用的应用市场：金山软件管家、太平洋下载中心、多多软件站、天空下载、腾讯软件管理。金山软件管家，是由金山网络技术有限公司所开发的软件管理工具。采用云安装技术，简化了各类软件安装的复杂步骤。金山软件管家是首款采用“云安装”技术的
Js防水涂料具有防水功效吗
JS复合防水涂料是吸收国外先进技术开发的，由有机涂料和无机粉料复合而成的既具有有机材料弹性高又有无机材料耐久性好等特点的新型双组份防水涂料。涂覆层可形成高强坚韧的防水涂膜，并可根据需要配制彩色涂层。1. 主要技术指标1)抗拉强度：&
华为电脑怎么录屏？
温馨提醒：录屏单次最长可录制 2 小时，且只能录制计算机系统声音，不能录制外部声音，例如环境声和人声。不同的电脑管家版本录制屏幕操作略有不同，您可以根据计算机当前版本，选择对应的操作。查看电脑管家版本：打开电脑管家，点击右上角四个点图标，点
电脑白屏怎么办
给风扇除尘，上油，或更换风扇，台式机在主机机箱内加个临时风扇，辅助散热，本本加散热垫。电脑白屏有以下原因及解决方法：1、散热不良，显示器、电源和CPU工作时间太长会导致死机，给风扇除尘，上油，或更换风扇，台式机在主机机箱内加个临时风扇，辅助
怎样获得html文本框里的值
html：&ltinput type="text" id="user"&gt&ltbutton onClick="beat()"&gtl
宏基电脑怎么重装系统？
1.启动计算机，并按住DEL键不放，直到出现BIOS设置窗口（通常为蓝色背景，黄色英文字）。2.选择并进入第二项，“BIOS SETUP”（BIOS设置）。在里面找到包含BOOT文字的项或组，并找到依次排列的“FIRST”“SECEND”
js中字符串的常见方法
首先创建一个字符串，创建字符串的方法有两种: 1.字面量：var str = "abc123efg456" 2.构造函数：var str = newString("abc123efg456")
网上买电脑最好在哪个网站买呢
网上买电脑推荐在京东自营上购买。京东是目前国内电脑销售市场最大的B2C平台，得益于该平台优秀的购物体验及售后服务。京东支持7天无理由退货，当买回电脑之后，无论是电脑有质量问题，还是外观不喜欢，或者用着不爽，或者后悔了，都可以在不影响二次销
如何自动整理桌面图标
具体操作步骤如下：1、首先打开电脑进入到电脑桌面中。2、然后在新弹出来的页面中鼠标右键单击电脑空白处并点击选择“查看”选项。3、之后在新弹出来的页面中点击勾选“自动排列图标”选项。4、然后在新弹出来的页面中电脑就可以自动整理桌面图标了。
用电脑如何查对方ID？
可以用dos命令查。x0dx0a1.首先最好是关闭与其他人的qq对话框。x0dx0a2.进入DOS（在开始，运行里输入cmd）。x0dx0a3.输入命令提示符：netstat -n。x0dx0a这时，会看到很多IP，先不着急
电脑上学英语用什么软件好
用AirCourse爱课AirCourse爱课和《可可英语》好。1、AirCourse爱课是一款专业的英语学习软件，有国外的语言专家倾力打造，让孩子们可以培养英语发音，绝对的地道纯正，软件绝对的免费，无偿提供给学生们使用，同时界面简洁，操作
新电脑装什么软件?
新买电脑需要装哪些软件，各有什么用途，越详细越好我买电脑时软件都是自己回来装的，没有让商家装。个人建议装以下软件，1，聊天QQ；2，暴风影音看视频；3，wps，建立文档，表格，ppt等；4，酷狗听音乐；5，搜狗输入法；6,360安全卫
如何在电脑上建立新的本地磁盘，求具体步骤！
可以按照以下方式进行操作：1、按住组合键Win+R打开运行窗口，在运行窗口中输入如下命令并执行compmgmt.msc。2、在打开的计算机管理中选择“磁盘管理”。3、选择一个剩余空间比较大的分区，比如选择分区G。4、右击G分区，在打开的快
数字证书在哪里安装
您好数字证书按以下方法安装首先，登陆你的T宝账号，进入个人管理页面，点击进入支付宝经过安全检测之后，你会进入支付宝。单击我的支付宝这一栏目下面的数字证书按钮，进入数字证书界面进入数字证书界面，你会发现，你虽然开通了数字证书服务（未开通的点击
怎么设置漂亮的表格的样式 css
下面来个例子，你可以复制到你的编辑器里修改测试&ltstyle type="textcss"&gttable.gridtable {}{font-family: verdana,arial,sans-s
电脑的显示器有哪些接口？
电脑显示器接口有以下几种：1、HDMI接口HDMI接口是一种高清接口，它不仅可以传输视频，还可以传输音频，现在好多的电视机、电脑都用这种接口。2、DP接口DP接口是数字式视频接口，它可以同时传输视频和音频。而且它兼容VGA和DVI接口
怎么让div透明，上面的文字不透明？
设置div透明度的时候可能会遇到这样一个问题，那就是对象中的文字也被产生了透明现象，也不能说事缺陷，也可能有时候需要这样的效果。这里就介绍一下如何将对象设置为透明效果，但是文字不透。rgba(),css3里才有的，所有只有支持css3的浏
怎样开启网络共享
问题一：如何设置网络共享？？1、右击“网上邻居”； 2、点击“属性”； 3、右击“本地连接”； 4、点击“属性”； 5、选择“TCPIP”； 6、点击“属性”； 7、选择“自动获的IP地址”和“自动获的DNS服
谷歌浏览器怎样设置支持html5语音输入
实现语音输入&ltinput type="text" x-webkit-speech &gt只要在input元素上加上x-webkit-speech属性就可以了。如果你用的是xhtml，那么就需要这样写
如何查看电脑是否被植入了挖矿程序
如何判断自己的电脑是否被挖矿，怎样预防？电脑开机后，所有程序都不打开的情况下。按Ctrl+ALT+Del调出任务管理器，在“进程”卡项中，查看CPU的使用情况。如果看到某个进程占用了大量的cpu使用情况，并且几分钟后都没有降低的趋势，这个程
买笔记本时说抽奖什么意思，还什么一等奖，三等奖？
部分笔记本电脑存在配件混用的恶臭情况你买到好的配件的版本就是一等奖，反之就是三等奖比如联想R7000存在京东方屏龙腾屏、三星内存海力士内存、三星固态海力士固态的情况前者是一等奖，后者是三等奖可以把大奖设置成中性的(j就是男孩女孩都喜欢
怎么用电脑清理手机垃圾
具体方法如下：（这里以苹果手机为例）准备工具：连接软件iTunes，数据线（用于手机连接）1、打开itools后，点击【应用】这一栏。2、在这里可以查看到APP实际内存与缓存占用的内存。3、勾中需要清理的软件，点击卸载就可以连缓存文件删
怎么用正则表达式替换html里面的一段代码
首先你这太省事了，至少把原文粘贴出来吧。正则代码：查找 &ltdiv class="ivu-tooltip-inner"&gt([^&lt]*)&ltdiv&gt替换为 &a

推荐阅读

热门文章

最新发布

标签列表

C# 正则表达式提取html中的文本

给您推荐相同类型的内容：