어떤 사람들은 프로그램을 크롤링 할 때 보물이지만 여전히 TND를 위해 판매하고 있습니다. 이 사람들이 정말 사실입니다! 어쩌면 다음은 약간 나쁩니다
다음은 쓰기-투-투어 기능이 없으며이 시점에 도달했습니다. 입력 기능은 매우 간단합니다. 필요한 경우 직접 완료하십시오. 스스로 다른 기능을 개선하십시오! 코드를 복사하여 직접 실행하여 효과를 확인하십시오.
dim url, list_pagecode, array_articleid, i, articleId
dim content_pagecode, content_tempcode
Dim Content_CategoryID, Content_CategoryName, BorderID, ClassID, BorderName, ClassName
Dim Articletitle, Articleeuthor, Article, Articlecontent
url = "http://www.webasp.net/article/class/1.htm"
list_pagecode = gethttppage (url)
list_pagecode = regexptext (list_pagecode, "print </th> </tr>", "</table> <테이블 테두리 = 0 CellPadding = 5", 0)
list_pagecode = regexptext (list_pagecode, "<td align = left> <a href = '../", "'> <img border = 0 src = '../images/authortype0.gif'", 1) '현재 목록 페이지의 기사 링크를 분리하려면.
array_articleid = split (list_pagecode, ",") '배열 생성 및 기사 ID를 저장
i = 0에서 ubound (array_articleid) -1
articleid = array_arrayid (i) 'arrayid
content_pagecode = gethttppage ( "http://www.webasp.net/article/"& articleid) '기사 페이지의 내용 얻기
'========================================================
content_tempcode = regexptext (content_pagecode, "<a href ="/article/""> 기술 자습서 </a> >> ",">> content </td> ", 0)
content_categoryId = regexptext (content_pagecode, "<a href = '../class", "/'>", 1)
BorderId = split (content_categoryId, ","(0) '큰 클래스 ID
classId = split (content_categoryId, ","(1) '서브 클래스 ID
'================ 주요 범주가 존재하는지 확인하십시오? ======================
'존재하지 않으면 데이터베이스를 입력하십시오
'=============== 주요 범주의 끝이 있는지 확인하십시오 =====================
'response.write (Borderid & ","& ClassId & "<br />")
content_categoryName = regexptext (content_pagecode, "/'>", "</a>", 1)
BorderName = split (content_categoryName, ","(0) '큰 클래스 이름
className = split (content_categoryName, ","(1) '서브 클래스 이름
'============== 서브 클래스가 존재하고 시작하는지 ===================
'존재하지 않으면 데이터베이스를 입력하십시오
'============== 서브 클래스가 존재하고 끝인지 확인 =================
'==============================================================
'======================================================================