일반 문자는 Metacharacters로 명시 적으로 지정되지 않은 인쇄 및 인쇄되지 않은 모든 문자로 구성됩니다. 여기에는 모든 대문자 및 소문자 알파벳 문자, 모든 숫자, 모든 구두점 마크 및 일부 기호가 포함됩니다.
가장 간단한 정규 표현식은 검색 된 문자열의 문자 자체와 일치하는 단일 일반 문자입니다. 예를 들어, 단일 문자 패턴 'a'는 검색 된 문자열의 어느 곳에서나 나타나는 문자 'a'와 일치 할 수 있습니다. 다음은 단일 특성 정규 표현 패턴의 몇 가지 예입니다.
/a/ /7/ /M/동등한 vbscript 단일 특성 정규식은 다음과 같습니다.
a 7 M더 큰 표현을 얻기 위해 여러 개의 단일 문자를 결합 할 수 있습니다. 예를 들어, 다음 JScript 정규식은 다른 것이 아니지만 단일 문자 표현식 'a', '7'및 'm'을 결합하여 생성 된 표현식입니다.
/a7M/동등한 vbscript 표현식은 다음과 같습니다.
a7M여기에는 연결 연산자가 없습니다. 당신이해야 할 일은 한 캐릭터를 다른 캐릭터 뒤에두기 만하면됩니다.
일치하려고 할 때 특별한 처리가 필요한 많은 Metacharacters가 있습니다. 이 특수 문자와 일치하려면 먼저 그들을 탈출해야합니다. 다음 표는 이러한 특수 문자와 그 의미를 제공합니다.
| 특수 문자 | 설명 |
|---|---|
| $ | 입력 문자열의 끝 위치와 일치합니다. regexp 객체의 멀티 린 속성이 설정되면 $도 '/n'또는 '/r'도 일치합니다. $ 문자 자체와 일치하려면 /$를 사용하십시오. |
| () | 하위 표현의 시작 및 종료 위치를 표시합니다. 나중에 사용하기 위해 하위 표현을 얻을 수 있습니다. 이 문자와 일치하려면 /(및 /)를 사용하십시오. |
| * | 이전 서브 발현이 0 또는 여러 번 일치합니다. * 문자와 일치하려면 / *를 사용하십시오. |
| + | 이전 하위 표현과 한 번 이상 일치합니다. + 문자와 일치하려면 / +를 사용하십시오. |
| . | 라인 브레이크/n을 제외한 단일 문자와 일치하십시오. 일치합니다., 사용 /. |
| [의 뜻 | 브래킷 표현의 시작을 표시하십시오. [, 사용 /[. |
| ? | 이전 하위 발현 0 또는 한 번과 일치하거나 비가비 한 예선을 나타냅니다. ? 일치하려면? |
| / | 다음 캐릭터를 특별한 캐릭터, 원시 캐릭터, 후진 참조 또는 옥탈 탈출 문자로 표시하십시오. 예를 들어, 'n'은 캐릭터 'n'과 일치합니다. '/n'은 Newline 캐릭터와 일치합니다. 시퀀스 '//'는/, '/('일치 (. |
| ^ | 사각형 브래킷 표현식에 사용되지 않는 한 입력 문자열의 시작 위치와 일치하며,이 시점에서 문자 컬렉션이 허용되지 않음을 의미합니다. ^ 문자 자체와 일치하려면 / ^를 사용하십시오. |
| { | 예선 표현식의 시작을 태그하십시오. {, aude /{. |
| | | 두 항목 사이에서 선택을 지정하십시오. 일치하려면 |, 사용 /|. |
가끔 사용해야하는 유용한 비 인쇄 문자가 많이 있습니다. 다음 표는 인쇄되지 않은 문자를 나타내는 데 사용되는 탈출 시퀀스를 보여줍니다.
| 성격 | 의미 |
|---|---|
| /c x | x 로 지정된 제어 문자와 일치합니다. 예를 들어, /cm은 Control-M 또는 Carriage Return과 일치합니다. X 의 값은 AZ 또는 AZ 중 하나 여야합니다. 그렇지 않으면 C를 원래 'C'문자로 취급하십시오. |
| /에프 | 페이지 브레이크와 일치하십시오. /x0c 및 /cl에 해당합니다. |
| /N | Newline 캐릭터와 일치하십시오. /x0a 및 /cj에 해당합니다. |
| /아르 자형 | 캐리지 리턴 문자와 일치합니다. /x0d 및 /cm에 해당합니다. |
| /에스 | 공백, 탭, 페이지 브레이크 등을 포함한 모든 공백 문자와 일치하십시오. [/f/n/r/t/v]와 동일합니다. |
| /에스 | 비 윈 스페이스 문자와 일치하십시오. [^/f/n/r/t/v]와 동일합니다. |
| /티 | 탭 문자와 일치하십시오. /x09 및 /ci에 해당합니다. |
| /다섯 | 수직 탭과 일치합니다. /x0b 및 /ck에 해당합니다. |
기간 (.)은 줄 브레이크 (/n)를 제외하고는 문자열의 단일 인쇄 또는 인쇄되지 않은 문자와 일치합니다. 다음 JScript 정규식은 'AAC', 'ABC', 'ACC', 'ADC'등과 일치 할 수 있으며 'A1C', 'A2C', AC '및 A#C'도 일치 할 수 있습니다.
/ac/동등한 vbscript 정규식은 다음과 같습니다.
ac기간 (.)이 입력 문자열의 일부인 파일 이름이 포함 된 문자열과 일치하려고하면이를 달성하기 위해 BackSlash (/) 문자로 정규 표현식의 기간을 접두사 할 수 있습니다. 예를 들어, 다음 JScript 정규식은 'filename.ext'와 일치 할 수 있습니다.
/filename/.ext/vbscript의 경우 동등한 표현식은 다음과 같습니다.
filename/.ext이러한 표현은 여전히 상당히 제한적입니다. 그들은 단일 캐릭터 만 일치 할 수 있습니다. 대부분의 경우 목록에서 특수 문자를 일치시키는 데 매우 유용합니다. 예를 들어, 입력 텍스트에 숫자로 표시된 장 제목이 1 장, 2 장 등으로 표시되면이 장 제목을 찾을 수 있습니다.
정사각형 브래킷 ([및])에 하나 이상의 단일 문자를 넣어 일치 할 목록을 만들 수 있습니다. 문자가 괄호로 둘러싸인 경우 목록을 브래킷 표현 이라고합니다. 다른 곳과 마찬가지로 괄호 안에서 일반 문자는 자신을 나타냅니다. 즉, 입력 텍스트에 나타나는 자체와 일치합니다. 대부분의 특수 캐릭터는 괄호 표현에있을 때 의미를 잃습니다. 몇 가지 예외는 다음과 같습니다.
브래킷 표현식에 포함 된 문자는 브래킷 표현식이 정규 표현식에있는 단일 문자 일뿐입니다. 다음 jscript 정규식은 '1 장', '2 장', '제 3 장', '4 장'및 '5 장'과 일치 할 수 있습니다.
/Chapter [12345]/vbscript의 동일한 장 제목과 일치하려면 다음 표현식을 사용하십시오.
Chapter [12345]'챕터'라는 단어와 다음 공백과 괄호 안의 문자 사이의 위치 관계는 고정되어 있습니다. 따라서 브래킷 표현식은 '챕터'라는 단어와 공간 직후에 단일 문자 위치를 만족시키는 일련의 문자를 지정하는 데만 사용됩니다. 여기에 아홉 번째 캐릭터 위치가 있습니다.
캐릭터 자체 대신 범위를 사용하여 일치 할 문자를 나타내려면 하이픈을 사용하여 범위의 시작 및 종료 문자를 분리 할 수 있습니다. 각 문자의 문자 값은 범위 내에서 상대 순서를 결정합니다. 다음 JScript 정규식은 상기 표시된 괄호리스트에 해당하는 범위 표현식을 포함합니다.
/Chapter [1-5]/VBSCIPT에서 동일한 함수의 표현은 다음과 같습니다.
Chapter [1-5]이러한 방식으로 범위가 지정되면 시작 및 최종 값이 해당 범위에 포함됩니다. 주목해야 할 한 가지는 유니 코드 정렬의 시작 값이 최종 값보다 먼저 있어야한다는 것입니다.
브래킷 표현식에 하이픈을 포함하려면 다음 방법 중 하나를 사용해야합니다.
[/-] [-az] [az-] [!--] [!-~]마찬가지로 목록의 시작 부분에 Caret (^)을 배치하면 목록이나 범위에없는 모든 문자를 찾을 수 있습니다. 목록의 다른 곳에 간병이 나타나면 특별한 의미없이 일치합니다. 다음 JScript 정규식은 장의 제목과 5보다 큰 장의 제목과 일치합니다.
/Chapter [^12345]/vbscript의 경우 사용하십시오.
Chapter [^12345]위에 표시된 예에서, 표현식은 1, 2, 3, 4 또는 5를 제외한 9 번째 위치의 숫자 문자와 일치합니다. 따라서 '7 장'은 일치하며 '제 9 장'도 마찬가지입니다.
상기 발현은 하이픈 (-)으로 표현 될 수있다. jscript :
/Chapter [^1-5]/또는 vbscript의 경우 다음과 같습니다.
Chapter [^1-5]브래킷 표현식의 일반적인 사용은 대문자 또는 소문자 알파벳 문자 또는 숫자와 일치하는 것을 지정하는 것입니다. 다음 JScript 표현식은이 일치를 제공합니다.
/[A-Za-z0-9]/동등한 vbscript 표현식은 다음과 같습니다.
[A-Za-z0-9]