'정규식'에 해당되는 글 2건

  1. 2011.04.27 ASP - 정규식 사용하여 html 본문의 A 태그 삭제하기 by 잠수콩
  2. 2011.04.15 ASP - 정규식을 이용한 html 중 img 태그만 추출 by 잠수콩


제목 : 정규식 사용하여 html 본문의 A 태그 삭제하기


Dim tt_pattern : tt_pattern = "a|span|div|table|tbody|tr|td|ul|li|p|strong"    'html 태그 삭제할 것들

'html editor 로 넘어온 값
dim CONTENT : CONTENT = "<span style=''><a href='asdfasfd'>어쩌구</a></span>"

CONTENT = ReplaceEndTag(RegExpReplace(tt_pattern, CONTENT, ""), tt_pattern)

'******************************************************

'*

'* Public Function RegExpReplace(Patrn, TrgtStr, RplcStr)

'*

'* RegExp.Replace() 메소드를 일반화한 함수

'*******************************************************

Public Function RegExpReplace(Patrn, TrgtStr, RplcStr)

  Dim ObjRegExp, RegExpTag

  On Error Resume Next

  RegExpTag = "(<("&Patrn&")(.*?)>)"

  Set ObjRegExp = New RegExp

  ObjRegExp.Pattern = RegExpTag

  ObjRegExp.Global = True

  ObjRegExp.IgnoreCase = True

  RegExpReplace = ObjRegExp.Replace(TrgtStr, RplcStr)

  Set ObjRegExp = Nothing

End Function


'******************************************************

'*

'* Public Function ReplaceEndTag(str_content)

'*

'*******************************************************

Public Function ReplaceEndTag(str_content, Patrn)

  Dim endtag, endtag_sp, i, str_txt

  endtag = Patrn

  endtag_sp = Split(endtag, "|")

  str_txt = str_content

  For i=0 To UBound(endtag_sp)

    str_txt = Replace(str_txt, "</"&endtag_sp(i)&">", "")

  Next

  ReplaceEndTag = str_txt

End Function




내용 : html 에디터에서 넘어온 html source 의 tag 중, 삭제하고 싶은 tag 만 삭제할 때 사용함

tt_pattern 에 "|"로 구분하여 tag 넣을 것 


출처 : 



저작자 표시 비영리 변경 금지
신고
Posted by 잠수콩


제목 : 정규식을 이용한 html 중 img 태그만 추출


'**************************************************

'*** 정규식으로 이미지만 뽑아내기 제거

'**************************************************

    Set regEx = New RegExp              ' 정규식을 작성합니다.

    regEx.IgnoreCase = True             ' 대/소문자 구분 안함을 설정합니다.

    regEx.Global = True                 ' 전역을 설정합니다.

 

 

    ''' 1. 이미지 태그만 가져오기

    regEx.Pattern = "<img [^<>]*>"      ' 패턴을 설정합니다.

    Set Matches = regEx.Execute(html)   ' 찾기를 실행합니다.

 

    RetStr = ""

 

    For Each Match in Matches   ' Matches 컬렉션을 반복합니다.

        RetStr = RetStr & "<br>" & Replace(Match.Value, "<", "&lt;") & vbcrlf

    Next

 

    Response.Write "1. 이미지 태그만 가져오기<br>" & RetStr & "<br><br><br>"

 ''' 2. 이미지 경로와 이미지명 가져오기
   regEx.Pattern = "[^= ']*\.(gif|jpg|bmp)"
   Set Matches = regEx.Execute(html)   ' 찾기를 실행합니다.

   RetStr = ""

   For Each Match in Matches   ' Matches 컬렉션을 반복합니다.
       RetStr = RetStr & "<br>" & Match.Value & vbcrlf
   Next

   Response.Write "2. 이미지 경로와 이미지명 가져오기<br>" & RetStr & "<br><br><br>"


   ''' 3. 이미지명만 가져오기
   regEx.Pattern = "[^= '/]*\.(gif|jpg|bmp)"
   Set Matches = regEx.Execute(html)   ' 찾기를 실행합니다.

   RetStr = ""

   For Each Match in Matches   ' Matches 컬렉션을 반복합니다.
       RetStr = RetStr & "<br>" & Match.Value & vbcrlf
   Next

   Response.Write "3. 이미지명만 가져오기<br>" & RetStr & "<br><br><br>"
 


내용 : html editor 로 넘어온 '내용' 글 중 img 태그만 추출 하는 것




저작자 표시 비영리 변경 금지
신고
Posted by 잠수콩