网络编程 
首页 > 网络编程 > 浏览文章

过滤所有HTML代码和CSS,JS

(编辑:jimmy 日期: 2024/11/15 浏览:3 次 )
复制代码 代码如下:
Function RemoveHTML(strHTML)    '过滤HTML代码的函数包括过滤CSS和JS


StrHtml = Replace(StrHtml,vbCrLf,"")

StrHtml = Replace(StrHtml,Chr(13)&Chr(10),"")

StrHtml = Replace(StrHtml,Chr(13),"")

StrHtml = Replace(StrHtml,Chr(10),"")

StrHtml = Replace(StrHtml," ","")

StrHtml = Replace(StrHtml,"    ","")


 Dim objRegExp, Match, Matches 

 Set objRegExp = New Regexp

 

 objRegExp.IgnoreCase = True

 objRegExp.Global = True


 '取闭合的<>

 objRegExp.Pattern = "<style(.+?)/style>"

 '进行匹配

 Set Matches = objRegExp.Execute(strHTML)

 

 ' 遍历匹配集合,并替换掉匹配的项目

 For Each Match in Matches 

 strHtml=Replace(strHTML,Match.Value,"")

 Next


  '取闭合的<>

 objRegExp.Pattern = "<script(.+?)/script>"

 '进行匹配

 Set Matches = objRegExp.Execute(strHTML)

 

 ' 遍历匹配集合,并替换掉匹配的项目

 For Each Match in Matches 

 strHtml=Replace(strHTML,Match.Value,"")

 Next


  '取闭合的<>

 objRegExp.Pattern = "<.+?>"

 '进行匹配

 Set Matches = objRegExp.Execute(strHTML)

 

 ' 遍历匹配集合,并替换掉匹配的项目

 For Each Match in Matches 

 strHtml=Replace(strHTML,Match.Value,"")

 Next


 RemoveHTML=strHTML

 Set objRegExp = Nothing

End Function

上一篇:正则表达式的语法
下一篇:得到连接和图片的地址 正则