最新发布

# 2023-02-17
CSS3与CSS的区别有哪些
一、指代不同1、CSS3：是CSS（层叠样式表）技术的升级版本，于1999年开始制订，2001年5月23日W3C完成了CSS3的工作草案。2、CSS：是一种用来表现HTML（标准通用标记语言的一个应用）或XML（标准通用标记语言的一个子
# 2023-02-17
html怎么固定位置
需要准备的材料分别有：电脑、浏览器、html编辑器。1、首先，打开html编辑器，新建html文件，例如：index.html。2、在index.html中的&ltbody&gt标签中，输入html代码：&ltbu
# 2023-02-17
我做好了html网页怎么加入后台，后台网上下载好了是CMS的
我做好了网页怎么加入后台，后台网上下载好了是CMS的需要懂一些基础的php知识，然后把静态页转换为相应的模板。最后应用到cms里。dw做好了网页如何后台管理？先是做静态网页，后台属于动态了，需要用到php,asp,.这些语言，如
# 2023-02-17
html选择器有哪些
您好。HTML选择器有以下类型。第一种是标签选择器，也成为元素选择器。标签选择器的基本形式如下：tagName{property:value}，其中tagName是标签名称，property是css的属性。第二种是类选择器，类选择器用来为
# 2023-02-17
html怎么设置滚动图片？
方案一：直接使用HTML的滚动标签 marquee ，把图片放入滚滚标签内部，代码如下：&ltmarquee&gt&ltimg src='1.jpg'&gt&ltimg sr
# 2023-02-17
css如何给图片加一个蒙版遮罩
1．首先，看一下HTML，一个img图像控件和一个带有样式的div，其中包含文本。这个就是蒙版遮罩层。2．然后，查看样式定义。先检查图像容器和图像样式，如图所示。其中要注意的是img_container样式里定义了position:rela
# 2023-02-17
css文字换行
用CSS让文字在一行内显示不换行的方法：一般的文字截断(适用于内联与块)：.text-overflow{display:block *内联对象需加*width:31emword-break:keep-a
# 2023-02-17
HTML如何让图片居中显示呢？
方法如下：1、首先新建a.html文件，并准备一张小标，如下：2、使用浏览器打开a.html，可以看到默认情况，是图片置顶对齐，文字置底对齐，所以通常图片高，文字低，不能水平居中对齐，如下：3、再次编辑a.html，加入以下css代码：
# 2023-02-17
html 让文本靠底部
html让文本靠底部的办法。如下参考：1、超文本标记语言是WWW的描述语言。设计HTML语言的目的是为了能把存放在一台电脑中的文本或图形与另一台电脑中的文本或图形方便地联系在一起，形成有机的整体，人们不用考虑具体信息是在当前电脑上还是在网
# 2023-02-17
css规范写法
一般css两种写法.class{样式1:样式1样式2:样式2样式3:样式3样式4:样式4}.class{样式1:样式1样式2:样式2样式3:样式3样式4:样式4}另一种是.class{样式1:样式1样式2:样式2样式3:样式3样

正则表达式如何过滤HTML标签中的属性值

2023-02-28 07:56:02html-css020

正则表达式如何过滤HTML标签中的属性值,第1张

1、过滤所有html标签的属性的正则表达式：

$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 JavaScript

"'<[\/\!]*?[^<>]*?>'si", // 去掉 HTML 标记

"'([\r\n])[\s]+'",// 去掉空白字符

"'&(quot|#34)'i",// 替换 HTML 实体

"'&(amp|#38)'i",

"'&(lt|#60)'i",

"'&(gt|#62)'i",

"'&(nbsp|#160)'i"

) // 作为 PHP 代码运行

$replace = array ("","","\\1","\"","&","<",">"," ")

$html = preg_replace($search, $replace, $html)

顶

import java.util.regex.Matcher

import java.util.regex.Pattern

/**

* <p>

* Title: HTML相关的正则表达式工具类

* </p>

* <p>

* Description: 包括过滤HTML标记，转换HTML标记，替换特定HTML标记

* </p>

* <p>

* Copyright: Copyright (c) 2006

* </p>

*

* @author hejian

* @version 1.0

* @createtime 2006-10-16

*/

public class HtmlRegexpUtil {

private final static String regxpForHtml = "<([^>]*)>"// 过滤所有以<开头以>结尾的标签

private final static String regxpForImgTag = "<\\s*img\\s+([^>]*)\\s*>"// 找出IMG标签

private final static String regxpForImaTagSrcAttrib = "src=\"([^\"]+)\""// 找出IMG标签的SRC属性

/**

*

*/

public HtmlRegexpUtil() {

// TODO Auto-generated constructor stub

}

/**

*

* 基本功能：替换标记以正常显示

* <p>

*

* @param input

* @return String

*/

public String replaceTag(String input) {

if (!hasSpecialChars(input)) {

return input

}

StringBuffer filtered = new StringBuffer(input.length())

char c

for (int i = 0i <= input.length() - 1i++) {

c = input.charAt(i)

switch (c) {

case '<':

filtered.append("<")

break

case '>':

filtered.append(">")

break

case '"':

filtered.append(""")

break

case '&':

filtered.append("&")

break

default:

filtered.append(c)

}

}

return (filtered.toString())

}

/**

*

* 基本功能：判断标记是否存在

* <p>

*

* @param input

* @return boolean

*/

public boolean hasSpecialChars(String input) {

boolean flag = false

if ((input != null) &&(input.length() >0)) {

char c

for (int i = 0i <= input.length() - 1i++) {

c = input.charAt(i)

switch (c) {

case '>':

flag = true

break

case '<':

flag = true

break

case '"':

flag = true

break

case '&':

flag = true

break

}

}

}

return flag

}

/**

*

* 基本功能：过滤所有以"<"开头以">"结尾的标签

* <p>

*

* @param str

* @return String

*/

public static String filterHtml(String str) {

Pattern pattern = Pattern.compile(regxpForHtml)

Matcher matcher = pattern.matcher(str)

StringBuffer sb = new StringBuffer()

boolean result1 = matcher.find()

while (result1) {

matcher.appendReplacement(sb, "")

result1 = matcher.find()

}

matcher.appendTail(sb)

return sb.toString()

}

/**

*

* 基本功能：过滤指定标签

* <p>

*

* @param str

* @param tag

*指定标签

* @return String

*/

public static String fiterHtmlTag(String str, String tag) {

String regxp = "<\\s*" + tag + "\\s+([^>]*)\\s*>"

Pattern pattern = Pattern.compile(regxp)

Matcher matcher = pattern.matcher(str)

StringBuffer sb = new StringBuffer()

boolean result1 = matcher.find()

while (result1) {

matcher.appendReplacement(sb, "")

result1 = matcher.find()

}

matcher.appendTail(sb)

return sb.toString()

}

/**

*

* 基本功能：替换指定的标签

* <p>

*

* @param str

* @param beforeTag

*要替换的标签

* @param tagAttrib

*要替换的标签属性值

* @param startTag

*新标签开始标记

* @param endTag

*新标签结束标记

* @return String

* @如：替换img标签的src属性值为[img]属性值[/img]

*/

public static String replaceHtmlTag(String str, String beforeTag,

String tagAttrib, String startTag, String endTag) {

String regxpForTag = "<\\s*" + beforeTag + "\\s+([^>]*)\\s*>"

String regxpForTagAttrib = tagAttrib + "=\"([^\"]+)\""

Pattern patternForTag = Pattern.compile(regxpForTag)

Pattern patternForAttrib = Pattern.compile(regxpForTagAttrib)

Matcher matcherForTag = patternForTag.matcher(str)

StringBuffer sb = new StringBuffer()

boolean result = matcherForTag.find()

while (result) {

StringBuffer sbreplace = new StringBuffer()

Matcher matcherForAttrib = patternForAttrib.matcher(matcherForTag

.group(1))

if (matcherForAttrib.find()) {

matcherForAttrib.appendReplacement(sbreplace, startTag

+ matcherForAttrib.group(1) + endTag)

}

matcherForTag.appendReplacement(sb, sbreplace.toString())

result = matcherForTag.find()

}

matcherForTag.appendTail(sb)

return sb.toString()

}

}

1、正则表达式去掉html标签代码如下：

/// <Header>/// 去除 HTML tag

/// </Header>

/// <param name="HTML">源</param>

/// <returns>结果</returns> public static string StripHTML(string HTML) //google "StripHTML" 得到{ string[] Regexs =

{

@"<script[^>]*?>.*?</script>",

@"<(\/\s*)?!?((\w+:)?\w+)(\w+(\s*=?\s*(([""'])(\\[""'tbnr]|[^\7])*?\7|\w+)|.{0})|\s)*?(\/\s*)?>",

@"([\r\n])[\s]+",

@"&(quot|#34)",

@"&(amp|#38)",

@"&(lt|#60)",

@"&(gt|#62)",

@"&(nbsp|#160)",

@"&(iexcl|#161)",

@"&(cent|#162)",

@"&(pound|#163)",

@"&(copy|#169)",

@"(\d+)",

@"-->",

@"<!--.*\n"

}

string[] Replaces =

{

"",

"",

"",

"\"",

"&",

"<",

">",

" ",

"\xa1", //chr(161),"\xa2", //chr(162),"\xa3", //chr(163),"\xa9", //chr(169),"",

"\r\n",

""

}

string s = HTML

for (int i = 0i <Regexs.Lengthi++)

{

s = new Regex(Regexs[i], RegexOptions.Multiline | RegexOptions.IgnoreCase).Replace(s, Replaces[i])

}

s.Replace("<", "")

s.Replace(">", "")

s.Replace("\r\n", "")

return s

}

}

2、可以直接复制到txt，然后保存成为.html，在浏览器中设置即可！

词库加载错误未能找到文件“E高铁采集器内存溢出ConfigurationDictStopwordstxt”

# 上一篇：微服务：Java EE的拯救者还是掘墓人?

# 下一篇：两台电脑怎么共享文件