* 去掉所有的HTML标记和JavaScript标记
*/
function replaceHtmlAndJs($document)
{
$document = trim($document)
if (strlen($document) <= 0) {
return $document
}
$search = array ("'<script[^>]*?>.*?</script>'si", // 去掉 javascript
"'<[\/\!]*?[^<>]*?>'si", // 去掉 HTML 标记
// "'([\r\n])[\s]+'",// 去掉空白字符
"'&(quot|#34)'i",// 替换 HTML 实体
"'&(amp|#38)'i",
"'&(lt|#60)'i",
"'&(gt|#62)'i",
"'&(nbsp|#160)'i"
) // 作为 PHP 代码运行
$replace = array ("",
"",
// "\1",
"\"",
"&",
"<",
">",
" "
)
return @preg_replace ($search, $replace, $document)
}
这个简单,用不上正则,直接字符串替换即可:$str = "<font size="2" face="楷体\\\\\\\_GB2312">犯罪研究与辩护部”、“刑民交叉研究与辩护部”等10余个专业部门。</font>"
$new_str = str_replace('size="2"', '', $str)// 这是替换为空
$new_str = str_replace('size="2"', 'size=""', $str)//这是替换为空属性值