권장 : ASP 및 액세스 링크 이 기사는 ASP 예제에서 ASP와 액세스를 연결하는 두 가지 방법을 보여줍니다. 다음은 참조 된 내용입니다. %dim dd, connstrdd = data.mdbconnstr = & q
수집 절차의 주요 단계는 다음과 같습니다.
1. 수집 된 페이지의 내용을 얻습니다
2. 획득 코드에서 사용 된 모든 데이터 추출
1. 수집 된 페이지의 내용을 얻습니다
현재 ASP에서 수집 된 페이지를 얻는 일반적으로 사용되는 방법을 알고 있습니다.
1. ServerXMLHTTP 구성 요소를 사용하여 데이터를 얻습니다
다음 내용은 프로그램 코드입니다.
| 다음은 인용 된 내용입니다. 기능 getbody (weburl) '개체를 만듭니다 Dim objxmlhttp set objxmlhttp = server.createobject (msxml2.serverxmlhttp) '요청 파일, 비동기 형식 objxmlhttp.open get, webuurl, false objxmlhttp.send OBJXMLHTTP.READYSTATE <> 4 OBJXMLHTTP.WAITFORRESPONSE 1000 향하게 하다 '결과를 얻으십시오 getbody = objxmlhttp.responsebody '개체를 해제하십시오 objxmlhttp = 아무것도 설정하지 않습니다 엔드 기능 |
통화 방법 :
getbody (파일의 URLF 주소)
데이터를 얻기 위해 2. 또는 XMLHTTP 구성 요소
다음 내용은 프로그램 코드입니다.
| 다음은 인용 된 내용입니다. 기능 getbody (weburl) '개체를 만듭니다 set retrieval = createobject (microsoft.xmlhttp) 검색과 함께 . Open Get, Weburl, False, .보내다 getbody = .ResponseBody 끝납니다 '개체를 해제하십시오 검색 = 아무것도 설정하지 않습니다 엔드 기능 |
통화 방법 :
getbody (파일의 URLF 주소)
이러한 방식으로 얻은 데이터는 사용하기 전에 인코딩 및 변환해야합니다.
다음 내용은 프로그램 코드입니다.
| 다음은 인용 된 내용입니다. 기능 bytestobstr (body, cset) 희미한 objstream set objstream = server.createobject (adodb.stream) objstream.type = 1 objstream.mode = 3 objstream.open objstream.write body objstream.position = 0 objstream.type = 2 objstream.charset = cset bytestobstr = objstream.readtext objstream.close objstream = 아무것도 설정하지 않습니다 엔드 기능 |
통화 방법 : ByTestObstr (변환 할 데이터, 인코딩) '인코딩은 일반적으로 GB2312 및 UTF-8으로 사용됩니다.
2. 획득 코드에서 사용 된 모든 데이터 추출
내가 마스터 한 방법은 다음과 같습니다.
1. ASP의 내장 중간 기능을 사용하여 필요한 데이터를 가로 채기
다음 내용은 프로그램 코드입니다.
기능 본체 (WSTR, 시작, 오버)
start = Newstring (WSTR, 시작)
'처리 할 데이터의 고유 한 시작 마크 설정
Over = Newstring (WSTR, Over)
'해당 시작은 처리 할 데이터의 유일한 엔드 마크입니다.
Body = Mid (WSTR, 시작, 오버 스타트)
'표시된 페이지의 범위를 설정하십시오
엔드 기능
Call Method : Body (수집 된 페이지의 내용, 시작 Mark, End Mark)
2. 규칙을 사용하여 필요한 데이터를 얻으십시오
다음 내용은 프로그램 코드입니다.
기능 본체 (WSTR, 시작, 오버)
xiaoqi = new regexp'set 구성 객체를 설정합니다
xiaoqi.ignorecase = true '사례를 무시하십시오
xiaoqi.global = true '전체 텍스트 검색으로 설정합니다
xiaoqi.pattern = & start &. ? & 오버 & '정규 표현
매치를 설정하십시오 = xiaoqi.execute (WSTR) '구성 실행을 시작하십시오
xiaoqi = 아무것도 설정하지 않습니다
몸 =
경기에서 각 경기마다
body = body & match.value '루프 일치
다음
엔드 기능
Call Method : Body (수집 된 페이지의 내용, 시작 Mark, End Mark)
절차 및 자세한 아이디어 수집 :
1. 웹 사이트 페이징 목록 페이지 페이지의 각 페이지의 주소를 얻습니다.
현재 대부분의 동적 웹 사이트에는 다음과 같은 페이징 주소에 대한 규칙이 있습니다.
동적 페이지
페이지 1 : index.asp? page = 1
페이지 2 : index.asp? page = 2
페이지 3 : index.asp? page = 3
..... .....
정적 페이지
페이지 1 : page_1.htm
2 페이지 : page_2.htm
페이지 3 : page_3.htm
..... .....
웹 사이트의 페이징 목록 페이지 페이지의 주소를 가져 오면 각 페이지의 주소를 변경하는 문자를 다음과 같은 변수로 바꾸면됩니다. 페이지 _ <%= & page &%>. htm
2. 수집 된 웹 사이트의 페이지 페이지의 내용을 얻습니다.
3. 페이징 목록 코드에서 수집 된 컨텐츠 페이지의 URL 연결 주소 추출
대부분의 페이징 페이지에서 컨텐츠 페이지를 연결하기위한 고정 된 규칙도 다음과 같습니다.
연결 1
연결 2
연결 3
다음 코드를 사용하여 URL Connection Collection을 얻으십시오.
다음 내용은 프로그램 코드입니다.
| 다음은 인용 된 내용입니다. xiaoqi = new regexp를 설정하십시오 xiaoqi.ignorecase = true xiaoqi.global = true xiaoqi.pattern =. ? 매치 세트 = xiaoqi.execute (페이지 목록 내용) xiaoqi = 아무것도 설정하지 않습니다 url = 경기에서 각 경기마다 url = url & match.value 다음 |
4. 수집 된 컨텐츠 페이지의 내용을 얻고 추출 마크에 따라 수집 된 컨텐츠 페이지에서 얻을 데이터를 가로 채립니다.
동적으로 생성 된 페이지이므로 대부분의 콘텐츠 페이지에는 동일한 HTML 태그가 있으며 이러한 일반 태그를 기반으로 필요한 컨텐츠의 각 부분의 내용을 추출 할 수 있습니다.
좋다:
각 페이지에는 웹 페이지 제목이 있습니다. 위에서 쓴 중간 절편 함수를 사용하여 그들 사이의 값을 얻거나 정규 표현식으로 얻을 수 있습니다.
예 : Body (,)
공유 : ASP를 사용하여 자신의 XML 파일 읽기 및 쓰기 방법을 사용자 정의하는 방법 그 전에는 XML을 결합한 ASP에 대한 두 개의 게시물을 작성하여 데이터베이스를 XML로 교체하고 데이터베이스를 XML과 통합하는 기술을 소개하여 데이터베이스가 더 이상 일부 경우 유일한 선택이 아닙니다. 기존 데이터베이스와 비교할 때 XML은 다음과 같은 장점이 있습니다