Uma breve discussão sobre o uso de objetos e colchetes regexp para expressões regulares JS

Autor：Eve Cole Data da Última Atualização：2025-08-30 06:32:02

Criação do objeto regexp:

A criação de expressões regulares regulares pode ser feita diretamente, ou seja, caracteres cercados por Slash "/". No entanto, em um ambiente em que as mudanças de parâmetros são necessárias, o construtor regexp () é uma escolha melhor:

var reg1 =/'/w+'/g;

var reg2 = novo regexp ('/' // w+/'', 'g');

Comparando os dois métodos de criação, o primeiro parâmetro no regexp é a sequência regular a ser criada. Por um lado, não é uma representação direta da quantidade, portanto, não está fechada com uma barra "/"; Em vez disso, a cotação marca "'" e o símbolo de escape "/" devem ser escapes quadráticos na corda.

Além disso, seja a quantidade direta ou o construtor regexp (), um novo objeto regexp é gerado e atribuído a uma variável.

Similaridades e diferenças entre Match () e EXEC ():

Match e Exec são maneiras comuns de combinar strings para expressões regulares. As funções implementadas pelos dois são semelhantes, com algumas diferenças sutis:

1. Como usar

Match é um método de embrulhar objetos com strings, uso: string.match (regexp);

Exec é um método de um objeto de expressão regular, uso: regexp.exec (string);

2. Resultados retornados

Quando o Regexp não define a bandeira global "G":

Os resultados de retorno de ambos são os mesmos. Ou seja, quando não há valor correspondente, ele retorna nulo e, quando há um valor correspondente, ele retorna uma matriz (vamos matriz). Array [0] é uma string correspondente, matriz [1], Array [2] ... corresponde a substâncias correspondentes aos parênteses em expressões regulares. Ao mesmo tempo, a matriz tem duas propriedades. Array.index representa a posição inicial da string correspondente e o Array.Input representa a sequência que está sendo recuperada.

Quando o Regexp tem o conjunto de "G" da bandeira global:

O Match retorna uma matriz quando houver um valor. Cada item da matriz representa todas as cordas que correspondem, portanto, não há mais substringas que correspondam aos parênteses. No momento, a matriz não possui atributo de índice e atributo de entrada.

O EXEC não é diferente do desempenho sem o rótulo global "G". A matriz de retorno, Array [0] é a string atual correspondente, matriz [1], Array [2] ... é a string de correspondência atual. Neste momento, preste atenção à propriedade LastIndex do objeto regexp, que representa a última posição no final da string correspondente na string original. Quando não há resultado mais correspondente, a propriedade LastIndex está definida como 0. Portanto, você pode usar o loop LastIndex para encontrar todas as seqüências de caracteres correspondentes.

Suportar vários métodos de correspondência:

Código JS

 var teststr = "agora test001 test002"; var re =/teste (/d+)/ig; var r = ""; while (r = re.exec (teststr)) {alert (r [0] + "" + r [1]); }

Além disso, você também pode usar o teststr.match (re), mas, dessa maneira, não há opção para G, e você só pode obter a primeira partida.

1. Regras de expressão regular

1.1 caracteres normais

Cartas, números, caracteres chineses, sublinhados e marcas de pontuação que não são especificamente definidos nos capítulos seguintes são todos "caracteres comuns". Quando um caractere normal em uma expressão corresponde a uma string, ela corresponde ao mesmo caractere que ele.

Exemplo 1: Quando a expressão "C", ao corresponder a string "ABCDE", o resultado correspondente é: sucesso; O conteúdo correspondente é: "C"; A posição correspondente é: Inicie em 2 e termine às 3. (Nota: o subscrito começa de 0 ou 1, o que pode variar dependendo da linguagem de programação atual)

Exemplo 2: Quando a expressão "BCD", ao corresponder à string "ABCDE", o resultado correspondente é: bem -sucedido; O conteúdo correspondente é: "BCD"; A posição correspondente é: Comece em 1 e termine em 4.

1.2 caracteres de fuga simples

Para alguns caracteres inconvenientes para escrever, use o método de adicionar "/" à frente. Já estamos familiarizados com esses personagens.

expressão	Correspondente
/r, /n	Representa o retorno do carro e a quebra de linha
/t	Símbolos de guia
//	Representa "/" em si

Existem outros pontos de pontuação que são especiais para uso nos capítulos seguintes. Depois de adicionar "/" à frente, eles representam o próprio símbolo. Por exemplo: ^ e $ têm significados especiais. Se você deseja corresponder aos caracteres "^" e "$" em uma string, a expressão precisa ser escrita como "/^" e "/$".

expressão	Correspondente
/^	Match ^ Símbolo em si
/$	Combine o próprio símbolo
/.	Corresponder ao ponto decimal (.)

O método de correspondência desses caracteres escapados é semelhante a "caracteres normais". Também corresponde ao mesmo personagem.

Exemplo 1: Quando a expressão "/$ d", ao corresponder à string "ABC $ de", o resultado correspondente é: sucesso; O conteúdo correspondente é: "$ d"; A posição correspondente é: Comece em 3 e termine em 5.

1.3 Expressões que podem corresponder a 'vários caracteres'

Alguns métodos de representação em expressões regulares podem corresponder a qualquer um dos "vários caracteres". Por exemplo, a expressão "/d" pode corresponder a qualquer número. Embora possa corresponder a qualquer caractere nele, ele pode ser apenas um, não múltiplo. É como ao jogar cartas de pôquer, os reis grandes e pequenos podem substituir qualquer cartão, mas eles só podem substituir uma carta.

expressão	Correspondente
/d	Qualquer número, qualquer um de 0 ~ 9
/c	Qualquer carta, número ou sublinhamento, ou seja, qualquer um de A ~ z, a ~ z, 0 ~ 9, _
/s	Qualquer um dos personagens de espaço em branco, incluindo espaços, guias, quebras de página, etc.
.	O ponto decimal pode corresponder a qualquer caractere, exceto o caractere da Newline (/n).

Exemplo 1: Quando a expressão "/d/d", ao corresponder "ABC123", o resultado da partida é: sucesso; O conteúdo correspondente é: "12"; A posição correspondente é: Comece em 3 e termine em 5.

Exemplo 2: Quando a expressão "A./D", ao corresponder "AAA100", o resultado da partida é: sucesso; O conteúdo correspondente é: "AA1"; A posição correspondente é: Comece em 1 e termine em 4.

1.4 Personalize expressões que podem corresponder a 'vários caracteres'

Use colchetes quadrados [] para conter uma série de caracteres que podem corresponder a qualquer um deles. Se você usa [^] para conter uma série de caracteres, pode corresponder a qualquer personagem que não seja os caracteres. Da mesma forma, embora possa corresponder a qualquer um deles, pode ser apenas um, não múltiplo.

expressão	Correspondente
[AB5@]	Combine "a" ou "b" ou "5" ou "@"
[^ABC]	Combine qualquer personagem que não seja "A", "B", "C"
[FK]	Combine qualquer carta entre "f" ~ "k"
[^A-f0-3]	Combine qualquer personagem que não seja "a" ~ "f", "0" ~ "3"

Exemplo 1: Quando a expressão "[BCD] [BCD]" corresponde "ABC123", o resultado da correspondência é: sucesso; O conteúdo correspondente é: "BC"; A posição correspondente é: Comece em 1 e termine em 3.

Exemplo 2: Quando a expressão "[^abc]" corresponde "ABC123", o resultado da correspondência é: sucesso; O conteúdo correspondente é: "1"; A posição correspondente é: Comece em 3 e termine em 4.

1.5 Símbolos especiais que modificam o número de correspondências

As expressões mencionadas no capítulo anterior podem corresponder apenas a um caractere ou qualquer um dos vários caracteres. Se você usar uma expressão mais um símbolo especial que modifica o número de correspondências, poderá repetir a correspondência sem escrever repetidamente a expressão.

O método de uso é: "Número de modificação" é colocado após a "expressão modificada". Por exemplo: "[bcd] [bcd]" pode ser escrito como "[bcd] {2}".

expressão	efeito
{n}	A expressão é repetida n vezes, por exemplo: "/w {2}" é equivalente a "/p/p"; "A {5}" é equivalente a "aaaaa"
{m, n}	A expressão é repetida pelo menos M vezes e na maioria das N vezes. Por exemplo: "ba {1,3}" pode corresponder "ba" ou "baa" ou "baaa"
{m,}	A expressão é repetida pelo menos M vezes, por exemplo: "/w/d {2,}" pode corresponder "A12", "_ 456", "M12344" ...
?	Combine a expressão 0 ou 1, que é equivalente a {0,1}, por exemplo: "A [CD]?" pode corresponder "a", "ac", "anúncio"
+	A expressão aparece pelo menos uma vez, o que é equivalente a {1,}. Por exemplo: "a+b" pode combinar "ab", "aab", "aaab" ...
*	A expressão não aparece ou ocorre nenhuma vez, o que é equivalente a {0,}. Por exemplo: "/^*b" pode corresponder "b", "^^^ b" ...

Exemplo 1: Quando a expressão "/d+/.?/d*" é comparada com "custa US $ 12,5", o resultado da correspondência é: bem -sucedido; O conteúdo correspondente é: "12.5"; A posição correspondente é: Comece às 10 e termine aos 14.

Exemplo 2: Quando a expressão "Go {2,8} GLE" é comparada com "anúncios de gooooogle", o resultado da partida é: sucesso; O conteúdo correspondente é: "Gooooogle"; A posição correspondente é: Comece às 7 e termine aos 17 anos.

1.6 Alguns outros símbolos especiais que representam significado abstrato

Alguns símbolos representam o significado especial da abstração nas expressões:

expressão	efeito
^	Combina o local onde a corda começa, não qualquer caractere
$	Corresponde ao fim da string, não correspondendo a nenhum caractere
/b	Combine um limite da palavra, ou seja, a posição entre a palavra e o espaço, e não corresponde a nenhum personagem

Outras descrições de texto ainda são relativamente abstratas; portanto, dê exemplos para ajudar todos a entender.

Exemplo 1: Quando a expressão "^aaa" corresponde "xxx aaa xxx", o resultado correspondente é: falhou. Porque "^" requer correspondência onde a string começa, "^aaa" pode corresponder apenas quando "AAA" estiver no início da string, por exemplo: "AAA XXX XXX".

Exemplo 2: Quando a expressão "AAA $" é comparada com "XXX AAA XXX", o resultado correspondente é: falhou. Como "$" requer correspondência com o final da string, "aaa $" pode corresponder apenas quando "AAA" estiver no final da string, por exemplo: "xxx xxx aaa".

Exemplo 3: quando a expressão "./b". é comparado com "@@@ ABC", o resultado correspondente é: bem -sucedido; O conteúdo correspondente é: "@A"; A posição correspondente é: Comece em 2 e termine em 4.

Explicação adicional: "/b" é semelhante a "^" e "$", que não corresponde a nenhum caractere, mas exige que esteja no lados esquerdo e direito da posição no resultado correspondente, um lado é a faixa "/w" e o outro lado é a faixa não-"/w".

Exemplo 4: Quando a expressão "/bend/b" corresponde "fim de semana, final, final,", o resultado correspondente é: bem -sucedido; O conteúdo correspondente é: "End"; A posição correspondente é: Comece aos 15 anos e termine aos 18.

Alguns símbolos podem afetar a relação entre subexpressões dentro de uma expressão:

expressão

efeito

O relacionamento "ou" entre as expressões nos lados esquerdo e direito, combinando com os lados esquerdo ou direito

()

(1). Quando o número de correspondências é modificado, a expressão entre colchetes pode ser modificada como um todo.

(2). Ao tomar o resultado correspondente, o conteúdo correspondente pela expressão entre colchetes pode ser obtido separadamente

Exemplo 5: Quando a expressão "Tom | Jack" corresponde à corda "Eu sou Tom, ele é Jack", o resultado correspondente é: bem -sucedido; O conteúdo correspondente é: "Tom"; A posição correspondente é: Comece às 4 e termine às 7. Ao corresponder a próxima, o resultado correspondente é: bem -sucedido; O conteúdo correspondente é: "Jack"; Quando a posição correspondente: começa aos 15 anos e termina aos 19 anos.

Exemplo 6: Expressão "(Go/S*)+" Ao corresponder "Vamos ir!", O resultado correspondente é: bem -sucedido; O conteúdo correspondente é: "Go Go Go"; A posição correspondente é: Comece às 6 e termine aos 14.

Exemplo 7: Quando a expressão "￥ (/d+/.?/D*)" é comparada com "￥ 10,9, ￥ 20,5", o resultado da correspondência é: bem -sucedido; O conteúdo correspondente é: "￥ 20,5"; A posição correspondente é: Comece em 6 e termine em 10. O conteúdo que obtém a faixa de suporte corresponde separadamente é: "20,5".

2. Algumas regras avançadas em expressões regulares

2.1 ganância e não-greeda nos tempos de partida

Ao usar símbolos especiais que modificam o número de correspondências, existem vários métodos de representação que permitem a mesma expressão para corresponder a diferentes tempos, como: "{m, n}", "{m,}", "?", "?", "*", "+". O número específico de correspondências depende da sequência correspondente. Essa expressão com um número incerta de correspondências repetidas sempre corresponde a quantas vezes possível durante o processo de correspondência. Por exemplo, para o texto "dxxxdxxxd", o seguinte é:

expressão	Resultados correspondentes
(d) (/w+)	"/w+" corresponderá a todos os personagens após o primeiro "d" "xxxdxxxd"
(d) (/w+) (d)	"/w+" corresponderá a todos os caracteres "xxxdxxx" entre o primeiro "d" e o último "d". Embora "/w+" também possa corresponder ao último "d", para fazer com que toda a expressão corresponda com sucesso, "/w+" pode "sair" o último "d" que poderia corresponder.

Pode -se observar que, quando "/w+" corresponde, ele sempre corresponde ao maior número possível de caracteres que atendem às suas regras. Embora no segundo exemplo, ele não corresponda ao último "D", é também fazer com que toda a expressão corresponda com sucesso. Da mesma forma, expressões com "*" e "{m, n}" combinam o máximo possível e expressões com "?" também são "combinados" o máximo possível quando podem corresponder ou incompatíveis. Esse princípio correspondente é chamado de padrão "ganância".

Modo sem graça:

Adicionando um "?" O sinal depois de modificar o símbolo especial do número de correspondências pode fazer expressões com um número variável de correspondências correspondentes o máximo possível, para que expressões que possam corresponder ou incompatibilidade possam ser "correspondentes o máximo possível. Esse princípio correspondente é chamado de padrão "não-greedoso", também chamado de padrão "Barb". Se houver poucas correspondências, fará com que toda a expressão falhe. Semelhante ao modo ganancioso, o modo não-greedoso corresponderá à extensão mínima para fazer com que toda a expressão corresponda com sucesso. Por exemplo, para o texto "dxxxdxxxd":

expressão	Resultados correspondentes
(d) (/w+?)	"/W+?" Combinará o mínimo de caracteres após o primeiro "D" possível, e o resultado é: "/W+?" Combina apenas um "X"
(d) (/w+?) (d)	Para que toda a expressão corresponda com sucesso, "/W+?" tem que corresponder "xxx" para fazer a correspondência "d" subsequente, para que toda a expressão seja correspondente com sucesso. Então, o resultado é: "/w+?" corresponde "xxx"

Para mais casos, consulte o seguinte:

Exemplo 1: Quando a expressão "<td> (.*) </td>" corresponde à string "<td> aa </td> <td> bb </td>", o resultado correspondente é: sucesso; A correspondência é "<td> aa </td>" a sequência inteira, e o "</td>" na expressão corresponderá ao último "</td>" na sequência.

Exemplo 2: Por outro lado, quando a expressão "<td> (.*?) </td>" corresponde à mesma string no Exemplo 1, você só obterá "<td> aa </td>". Ao combinar o próximo novamente, você receberá o segundo "<td> bb </td>".

2.2 BackReferências /1, /2 ...

Quando uma expressão corresponde, o mecanismo de expressão registra a sequência correspondente pela expressão contida no suporte "()". Ao obter o resultado correspondente, a string correspondente pela expressão contida entre colchetes pode ser obtida separadamente. Isso foi demonstrado muitas vezes nos exemplos anteriores. Em aplicações práticas, quando um determinado limite é usado para pesquisar, e o conteúdo a ser recuperado não contém limites, os suportes devem ser usados para especificar o intervalo desejado. Por exemplo, o "<td> (.*?) </td>".

De fato, "a string correspondente pela expressão contida entre colchetes" pode não apenas ser usada após o término da partida, mas também durante o processo de correspondência. A peça após a expressão pode se referir à "string sub-match que foi correspondente" anterior entre parênteses. O método de referência é adicionar um número "/". "/1" refere -se à string correspondente no primeiro par de colchetes, "/2" refere -se à string correspondente no segundo par de colchetes ... e assim por diante, se um par de colchetes contiver outro par de colchetes, os colchetes forem classificados primeiro. Em outras palavras, se o par tiver o suporte esquerdo "(" antes, o par será classificado primeiro.

Como exemplo:

Exemplo 1: A expressão "('|") (.*?) (/1) "ao corresponder"' hello ', "World" ", o resultado da correspondência é: bem -sucedido; o conteúdo correspondente é:"' Hello '.

Exemplo 2: Quando a expressão "(/w)/1 {4,}" é comparada com "AA BBBB ABCDEFG CCCCC 111121111 9999999999999", o resultado da partida é: bem -sucedido; O conteúdo correspondente é "CCCCCC". Quando você combina o próximo novamente, você receberá 999999999. Essa expressão requer caracteres no intervalo "/w" para serem repetidos pelo menos 5 vezes, prestando atenção à diferença de "/w {5,}".

Exemplo 3: a expressão "<(/w+)/s*(/w+(= ('|").*?/4)?/S*)*>.*? bem-sucedido.

2.3 Pré-pesquisa, incompatibilidade; Pesquisa reversa, incompatibilidade

No capítulo anterior, falei sobre vários símbolos especiais representando significados abstratos: "^", "$", "/b". Todos eles têm uma coisa em comum: eles mesmos não correspondem a nenhum personagem, mas apenas anexam uma condição a "duas extremidades de uma corda" ou "fendas entre os personagens". Depois de entender esse conceito, esta seção continuará introduzindo outro método de representação mais flexível que adiciona condições a "duas extremidades" ou "fendas".

Avanço de pré-pesquisa: "(? = Xxxxx)", "(?! Xxxxx)"

Formato: "(? = Xxxxx)", na sequência correspondente, a condição conectada à "fenda" ou "duas extremidades" é que o lado direito da lacuna deve ser capaz de corresponder à expressão da parte xxxxx. Por ser apenas uma condição adicional nessa lacuna, não afeta a expressão subsequente para corresponder verdadeiramente aos caracteres após essa lacuna. Isso é semelhante a "/b", que não corresponde a nenhum personagem. "/b" apenas pega os personagens antes e depois da lacuna e faz um julgamento, e não afetará as expressões para trás para realmente corresponder.

Exemplo 1: Quando a expressão "Windows (? = Nt | xp)" é correspondida com "Windows 98, Windows NT, Windows 2000", ele só corresponderá ao "Windows" em "Windows NT" e outras palavras "Windows" não serão correspondentes.

Exemplo 2: Expressão "(/w) ((? =/1/1/1) (/1))+" Ao corresponder a string "aaa ffffff 9999999999", será capaz de corresponder aos 4 primeiros de 6 "f" e os primeiros 7 de 9 "9". Essa expressão pode ser lida e interpretada como: repetir o número alfanumérico mais de 4 vezes corresponderá à peça antes dos últimos 2 dígitos. Obviamente, essa expressão não pode ser escrita assim, e o objetivo aqui é para fins de demonstração.

Formato: "(?! Xxxxx)", o lado direito da lacuna não deve corresponder à expressão xxxxx.

Exemplo 3: Expressão "((?!/Bstop/b).)+" Ao corresponder "fdjka ljfdl stop fjdsla fdj", será correspondente do início à posição antes de "parar". Se não houver "parar" na string, a string inteira será correspondida.

Exemplo 4: A expressão "do (?!/W)" só pode corresponder "a" ao combinar a string ", faça, cachorro". Neste artigo, o efeito de usar "Do" depois "(?!/W)" e usar "/b" é o mesmo.

Pesquisa reversa: "(? <= Xxxxx)", "(? <! Xxxxx)"

Os conceitos desses dois formatos são semelhantes à pré-pesquisa avançada. Os requisitos para a pré-pesquisa reversa são: o "lado esquerdo" da lacuna. Os dois formatos exigem que possam ser capazes de corresponder e não devem ser capazes de corresponder à expressão especificada, em vez de julgar o lado direito. Como "Avançar a Pesquisa": ambos são uma condição adicional para a lacuna em que estão localizados e não correspondem a nenhum personagem.

Exemplo 5: A expressão "(? <=/D {4})/d+(? =/D {4})" ao corresponder "1234567890123456", os 8 números do meio, exceto os 4 primeiros números e os últimos 4 números serão correspondidos. Como o JScript.Regexp não suporta a pré-pesquisa reversa, este artigo não pode ser demonstrado. Muitos outros motores podem suportar a pré-pesquisa reversa, como: pacote java.util.Regex acima do jamespace java 1.4, o espaço de nome do System.Text.ReGularexpressions no .NET e o motor regular de Deelx mais simples e fácil recomendado por este site.

3. Outras regras comuns

Existem também algumas regras mais comuns entre vários motores de expressão regular, que não foram mencionados na explicação anterior.

3.1 nas expressões, "/xxx" e "/uxxxx" pode ser usado para representar um caractere ("x" significa um número hexadecimal)

forma	Alcance de caracteres
/xxx	Personagens com números no intervalo de 0 a 255, como: os espaços podem ser representados por "/x20"
/uxxxxx	Qualquer caractere pode ser representado por "/u" mais seu número de números hexadecimais de 4 dígitos, como "/médio"

3.2 Enquanto as expressões "/s", "/d", "/w", "/b" representam significados especiais, as letras maiúsculas correspondentes representam significados opostos

expressão	Correspondente
/S	Combine todos os caracteres que não são do WhitaSpace ("/S" podem corresponder aos caracteres individuais do espaço em branco)
/D	Combine todos os caracteres não numéricos
/C	Combine todos os personagens que não sejam letras, números e sublinhados
/B	Combine os limites não-palavras, ou seja, lacunas de personagens quando os dois lados estão "/w" nos lados esquerdo e direito não estão "/w" nos lados esquerdo e direito não estão "/w" nos lados esquerdo e direito não estão

3.3 Existe um significado especial na expressão e é necessário adicionar "/" para corresponder ao resumo do personagem do próprio personagem.

personagem	ilustrar
^	Corresponde à posição inicial da sequência de entrada. Para combinar com o próprio personagem "^", use "/^"
$	Corresponde à posição final da sequência de entrada. Para corresponder ao próprio personagem "$", use "/$"
()	Marca as posições de início e final de uma subexpressão. Para combinar com os colchetes, use "/(" e "/)"
[]	Use expressões personalizadas que possam corresponder a 'vários caracteres'. Para combinar com os colchetes, use "/[" e "/]"
{}	Símbolos que modificam o número de correspondências. Para combinar com aparelhos, use "/{" e "/}"
.	Combine qualquer caractere, exceto a nova linha (/n). Para combinar com o ponto decimal, use "/".
?	O número de correspondências de modificação é 0 ou 1. Para corresponder ao "?" O próprio personagem, use "/?"
+	O número de correspondências de modificação é pelo menos 1 tempo. Para combinar com o próprio personagem "+", use "/+"
*	O número de correspondências de modificação é 0 ou qualquer. Para combinar com o próprio personagem "", use "/"
\|	A relação "ou" entre as expressões nos lados esquerdo e direito. Match "\|" por si só, use "/\|"

3.4 Subexpressão entre colchetes "()". Se você deseja que o resultado correspondente não seja gravado para uso futuro, você pode usar o formato "(?: xxxxx)"

Exemplo 1: Quando a expressão "(?: (/W)/1)+" corresponde a "um bbccdd efg", o resultado é "bbccdd". O resultado correspondente do suporte "(? :)" Range não está gravado, então "(/w)" é usado para fazer referência a ele.

3.5 Introdução às configurações de atributo de expressão comumente usadas: Ignorecase, Singleline, Multiline, Global

Propriedades de expressão	ilustrar
Ignorecase	Por padrão, as cartas nas expressões são sensíveis ao caso. Configurar como o ignorecase torna o caso insensível ao corresponder. Alguns mecanismos de expressão estendem o conceito de "caso" ao caso da faixa Unicode.
Singleline	Por padrão, o ponto decimal "." Corresponde a caracteres que não sejam quebras de linha (/n). Configure como singleline para fazer com que o ponto decimal corresponda a todos os personagens, incluindo quebras de linha.
Multilina	Por padrão, as expressões "^" e "$" correspondem apenas ao começo ① e das posições finais ④ da string. como: ①xxxxxxxx2/n ③xxxxxxxxxx④ Configure a multilina para fazer "^" corresponder a ① e também pode corresponder à posição ③ antes da próxima linha começar, para que "$" corresponda ④ e também possa corresponder à posição ② antes da nova linha e terminar com uma linha.
Global	Ele funciona principalmente ao usar expressões para substituir e é configurado como global para substituir todas as correspondências.

4. Outras dicas

4.1 Se você deseja entender que os motores regulares avançados também suportam sintaxe regular complexa, consulte a documentação do mecanismo regular Deelx neste site.

4.2 Se você deseja exigir a expressão para corresponder a toda a string, em vez de encontrar uma peça da string, você pode usar "^" e "$" no início e no final da expressão, por exemplo: "^/d+$" exige que a sequência inteira tenha apenas números.

4.3 Se o conteúdo necessário para corresponder for uma palavra completa e não faz parte da palavra, use "/b" no início e no final da expressão, por exemplo: use "/b(iflighhile|Else|Void|Int...)/b" para corresponder às palavras -chave no programa.

4.4 A expressão não corresponde a uma corda vazia. Caso contrário, a partida será bem -sucedida o tempo todo e nada será correspondido. Por exemplo: quando você está se preparando para escrever uma expressão que corresponda a "123", "123.", "123.5", ".5", etc., números inteiros, pontos decimais e números decimais podem ser omitidos, mas não escreva a expressão como: "/d*/.?/d*", porque não há nada, isso também pode corresponder com sucesso. Uma maneira melhor de escrever é: "/d+/.?/d*|/./d+".

4.5 Não faça loop infinitamente para sub-matches que podem corresponder a strings vazios. Se cada parte da subexpressão entre os colchetes puder corresponder 0 vezes e os colchetes como um todo podem corresponder aos tempos infinitos, a situação poderá ser mais grave do que o artigo anterior dizia, e o processo de correspondência pode ser um loop morto. Embora alguns mecanismos regulares de expressão tenham evitado o loop morto nessa situação, como expressões regulares .NET, ainda devemos tentar evitar essa situação. Se encontrarmos um loop morto ao escrever expressões, também podemos começar deste ponto de vista e descobrir se esse é o motivo mencionado neste artigo.

4.6 Escolha razoavelmente o modo ganancioso e o modo não-greedoso, consulte a discussão do tópico.

4.7 ou "|" Nos lados esquerdo e direito, é melhor combinar apenas um lado de um determinado personagem, para que as expressões de ambos os lados de "|" não diferirá devido à posição de troca.

Próximo artigo ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

1. Defina expressões regulares

1) Existem duas formas de definição de expressões regulares, uma é o método comum e o outro é o método do construtor.

2) Método normal: var reg =/expressão/parâmetros adicionais

Expressão: Uma sequência representando uma certa regra, onde certos caracteres especiais podem ser usados para representar regras especiais, que serão explicadas em detalhes posteriormente.

Parâmetros adicionais: usado para estender o significado da expressão, atualmente existem três parâmetros principais:

G: significa que a correspondência global pode ser realizada.

I: Isso significa correspondência insensível ao caso.

M: Significa que a correspondência de múltiplas linhas pode ser executada.

Os três parâmetros acima podem ser combinados arbitrariamente para representar o significado do composto e, é claro, não há parâmetros adicionados.

exemplo:

var reg =/a*b/;

var reg =/abc+f/g;

3) Método do construtor: var reg = new regexp ("expressão", "add parâmetros");

O significado de "expressão" e "parâmetros adicionais" é o mesmo que o método de definição acima.

exemplo:

var reg = novo regexp ("a*b");

var reg = novo regexp ("abc+f", "g");

4) A diferença entre métodos comuns e métodos construtores

Uma expressão da maneira normal deve ser uma sequência constante, enquanto a expressão no construtor pode ser uma string constante ou uma variável JS, como um parâmetro de expressão com base na entrada do usuário, etc.:

var reg = new regexp (document.forms [0] .exprfiled.value, "g");

2. Padrão de expressão

1) Padrão de expressão refere -se ao método e estilo de expressão da expressão, ou seja, como descrever a "expressão" em var =/expressão/parâmetros adicionais?

2) De uma perspectiva padronizada, os padrões de expressão são divididos em padrões simples e padrões compostos.

3) Padrão simples: refere -se a um padrão expresso através da combinação de caracteres comuns, por exemplo

var reg =/abc0d/;

Pode -se ver que padrões simples podem representar apenas correspondências específicas.

4) Padrão de composto: refere -se a um padrão expresso com caracteres curinga, por exemplo:

var reg =/a+b?/w/;

O +,? e /w são todos caracteres curinga e representam significados especiais. Portanto, o padrão composto pode expressar mais lógica abstrata.

Vamos nos concentrar no significado e no uso de cada curinga no modo composto.

5) Explicação de caracteres especiais no modo composto:

1>/: é usado como um caractere de fuga em muitas linguagens de programação. De um modo geral

Se o símbolo for seguido pelo caractere comum C, então / c representa um significado especial. Por exemplo, n representa originalmente o caractere n, mas /n representa uma nova linha.

Se o / símbolo for seguido por um caractere especial C, então / c representa o caractere comum c. Por exemplo, / é geralmente usado como um caractere de fuga, mas // é usado para ajustar o caractere comum /.

O uso de / na expressão regular de JavaScript é o mesmo que acima, mas em diferentes linguagens de programação, as tabelas de caracteres especiais podem ser diferentes.

2>^: Combine o início da sequência de entrada. Se for uma correspondência de várias linhas, ou seja, os parâmetros adicionais da expressão contêm M, ela também será correspondida após uma nova linha.

exemplo:

/^B/corresponde ao primeiro b em "Bab BC"

Exemplo 2:

/^B/gm correspondência

“Badd b

CDAF

B dsfb ”

A primeira linha no primeiro B, o primeiro B na terceira linha

3> $: corresponda ao final da criação de caracteres de entrada. Se for uma correspondência de várias linhas, ou seja, os parâmetros adicionais da expressão contêm M, ela também será correspondida antes de uma nova linha.

Ao contrário do uso de ^.

Exemplo: / T $ / Matches em "Bat", mas não corresponde a "Hate"

Exemplo 2: /T $ /Match

“Tag em

bastão"

O último T da primeira linha e o T da segunda linha.

4>*: Combine o caractere anterior 0 ou mais vezes.

Exemplo: /ab* /corresponde "abbbb" em "dddabbbbbc", e também combina "a" em "ddda"

5>+: Combine o caractere anterior 1 ou mais vezes.

Exemplo: / ab+ / corresponde "abbbb" em "dddabbbbbc", mas não corresponde a "ddda"

Semelhante ao uso dos seguintes {1,} (protótipo: {n,})

6>?: O uso de? é bastante especial. De um modo geral, é usado para corresponder ao personagem anterior 0 vezes ou 1 tempo, mas possui outros dois usos especiais:

Se imediatamente segui -se *, +,? e {}, significa o número mínimo de correspondências da partida original, por exemplo:

/ ba*/ originalmente correspondente "baaaa" em "bbbaaaaa", mas/ ba*?/ correspondente "b" em "bbbaaaa" (porque*significa 0 ou mais correspondências, enquanto mais?

Da mesma forma: / ba+? / Corresponde "ba" em "baaaa".

Como um símbolo da estrutura de sintaxe, ele é usado na pré-avaliação, ou seja, x (? = Y) e x (?! = Y) a ser mencionado posteriormente.

7>.: O "." Assinar o ponto decimal corresponde a qualquer caractere, exceto o caractere de nova linha.

Quais são os personagens do padrão no total? Consulte: Conjunto de personagens

Por exemplo: / ab / corresponde "ACB" em "ACBAA", mas não corresponde a "Abbb".

8> (x): significa corresponder x (não se referindo especificamente ao caractere x ou se referindo especificamente a um caractere, x representa uma string) e a correspondência será lembrada. Em sintaxe, esse tipo de () é chamado de "captura de pais", ou seja, os colchetes usados para capturar.

As correspondências são lembradas porque, nas funções fornecidas pela expressão, algumas funções retornam uma matriz que mantém todas as seqüências de correspondência, como a função EXEC ().

Observe também que a premissa de que x () é lembrada é corresponder a x.

Exemplo 1:

var regx =/a (b) c/;

var rs = regx.exec ("abcddd");

Como pode ser visto no acima, / a (b) C / corresponde a "ABC" em "ABCDDD". Por causa de (), B também o gravará, então o conteúdo numérico retornado por RS é:

{abc, b}

Exemplo 2:

var regx =/a (b) c/;

var rs = regx.exec ("acbcddd");

RS retorna nulo, porque / a (b) c / não corresponde a "acbcddd", portanto b em () não será gravado (embora a string contenha b)

9> (?: X): Combine x, mas não se lembre de x. () Nesse formato, é chamado de "pais não capturados", ou seja, suportes para não captura.

exemplo:

var regx =/a (?: b) c/;

var rs = regx.exec ("abcddd");

Como pode ser visto no exposto, / a (?: b) c / corresponde "ABC" em "ABCDDD", por causa de (? :), B não será gravado, então o conteúdo numérico retornado por rs é:

{abc}

10> x (? = Y): corresponde a x, apenas se Y for seguido imediatamente. Se as partidas das partidas, apenas X será lembrado e Y não será lembrado.

exemplo:

var regx =/user (? = nome)/;

var rs = regx.exec ("O nome de usuário é Mary");

Resultado: a correspondência é bem -sucedida e o valor de Rs é {user}

11> x (?! Y): Combine x, apenas se Y não for seguido imediatamente. Se as partidas das partidas, apenas X será lembrado e Y não será lembrado.

exemplo:

var regx =/user (?! nome)/;

var rs = regx.exec ("o nome do usuário é Mary");

Resultado: a correspondência é bem -sucedida e o valor de Rs é {user}

Exemplo 2:

var regx = // d+(?!/.)/;

var rs = regx.exec ("54.235");

Result: The matching result, the value of rs is {5}, and the mismatch is because 54 is followed by the "." sinal. Of course, 235 also matches, but due to the behavior of the exec method, 235 will not be returned.

12>x|y：匹配x或y。注意如果x和y都匹配上了，那么只记住x。

exemplo:

var regx=/beijing|shanghai/;

var rs=regx.exec(“I love beijing and shanghai”);

结果：匹配成功，rs的值为{beijing}，虽然shanghai也匹配，但不会被记住。

13>{n}：匹配前一个字符的n次出现。

n必须是一个非负数，当然如果是一个负数或小数也不会报语法错误。

exemplo:

var regx=/ab{2}c/;

var rs=regx.exec(“abbcd”);

结果：匹配成功，rs的值为：{abbc}。

14>{n,}：匹配前一个字符的至少n次出现。

exemplo:

var regx=/ab{2,}c/;

var rs=regx.exec(“abbcdabbbc”);

结果：匹配成功，rs的值为：{abbc}。注意为什么abbbc也符合条件为什么没有被记住，这与exec方法的行为有关，后面会统一讲解。

15>{n,m}：匹配前一个字符的至少n次最多m次的出现。

只要n与m为数字，而且m>=n就不会报语法错误。

exemplo:

var regx=/ab{2,5}c/;

var rs=regx.exec(“abbbcd”);

结果：匹配成功，rs的值为：{abbbc}。

Exemplo 2:

var regx=/ab{2,2}c/;

var rs=regx.exec(“abbcd”);

结果：匹配成功，rs的值为：{abbc}。

例子3：

var regx=/ab(2,5)/;

var rs=regx.exec(“abbbbbbbbbb”);

Result: The match is successful, and the value of rs is: {abbbbb}, which means that if the previous character appears more than m times, it will only match m times. além disso:

var regx=/ab(2,5)c/;

var rs=regx.exec(“abbbbbbbbbbc”);

结果：匹配失败，rs的值为：null，为什么匹配失败，因为b多于5个则b(2,5)会匹配前5个b，，而表达式/ab(2,5)c/中b后面是c，但字符串中5个b之后还是b所以会报错。

16>[xyz]：xyz表示一个字符串，该模式表示匹配[]中的一个字符，形式上[xyz]等同于[xz]。

exemplo:

var regx=/a[bc]d/;

var rs=regx.exec(“abddgg”);

结果：匹配成功，rs的值为：{abd}

Exemplo 2:

var regx=/a[bc]d/;

var rs=regx.exec(“abcd”);

结果：匹配失败，rs的值为：null，之所以失败，是因为[bc]表示匹配b或c中的一个，但不会同时匹配。

17>[^xyz]：该模式表示匹配非[]中的一个字符，形式上[^xyz]等同于[^xz]。

exemplo:

var regx=/a[^bc]d/;

var rs=regx.exec(“afddgg”);

结果：匹配成功，rs的值为：{afd}

Exemplo 2:

var regx=/a[^bc]d/;

var rs=regx.exec(“abd”);

结果：匹配失败，rs的值为：。

18>[/b]：匹配退格键。

19>/b：匹配一个词的边界符，例如空格和换行符等等，当然匹配换行符时，表达式应该附加参数m。

exemplo:

var regx=//bc./;

var rs=regx.exec(“Beijing is a beautiful city”);

结果：匹配成功，rs的值为：{ci}，注意c前边的空格不会匹配到结果中，即{ ci}是不正确的。

20>/B：代表一个非单词边界。

exemplo:

var regx=//Bi./;

var rs=regx.exec(“Beijing is a beautiful city”);

结果：匹配成功，rs的值为：{ij}，即匹配了Beijing中的ij。

21>/cX，匹配一个控制字符。例如， /cM 匹配一个Control-M 或

回车符。 x 的值必须为AZ 或az 之一。否则，将c 视为一

个原义的'c' 字符。（实际的例子还需补充）

21>/d：匹配一个数字字符，等同于[0-9]。

exemplo:

var regx=/user/d/;

var rs=regx.exec(“user1”);

结果：匹配成功，rs的值为：{user1}

22>/D：匹配一个非数字字符，等同于[^0-9]。

exemplo:

var regx=/user/D/;

var rs=regx.exec(“userA”);

结果：匹配成功，rs的值为：{userA}

23>/f：匹配一个换页符。

24>/n：匹配一个换行符。因为是换行符，所以在表达式中要加入m参数。

exemplo:

var regx=/a/nbc/m;

var str=“a

bc”;

var rs=regx.exec(str);

结果：匹配成功，rs的值为：{ }，如果表达式为/a/n/rbc/，则不会被匹配，因此在一般的编辑器中一个”Enter”键代表着“回车换行”，而非“换行回车”，至少在textarea域中是这样的。

25>/r：匹配一个回车符

26>/s：匹配一个空格符，等同于[ /f/n/r/t/v/u00A0/u2028/u2029].

exemplo:

var regx=//si/;

var rs=regx.exec(“Beijing is a city”);

结果：匹配成功，rs的值为：{ i}

27>/S：匹配一个非空格符，等同于[ ^/f/n/r/t/v/u00A0/u2028/u2029].

exemplo:

var regx=//Si/;

var rs=regx.exec(“Beijing is a city”);

结果：匹配成功，rs的值为：{ei}

28>/t：匹配一个tab

exemplo:

var regx=/a/tb/;

var rs=regx.exec(“a bc”);

结果：匹配成功，rs的值为： {a bc}

29>/v：匹配一个竖向的tab

30>/w：匹配一个数字、_或字母表字符，即[A-Za-z0-9_ ]。

exemplo:

var regx=//w/;

var rs=regx.exec(“$25.23”);

结果：匹配成功，rs的值为：{2}

31>/W：匹配一个非数字、_或字母表字符，即[^A-Za-z0-9_ ]。

exemplo:

var regx=//w/;

var rs=regx.exec(“$25.23”);

结果：匹配成功，rs的值为：{$}

32>/n：注意不是/n，这里n是一个正整数，表示匹配第n个()中的字符。

exemplo:

var regx=/user([,-])group/1role/;

var rs=regx.exec(“user-group-role”);

结果：匹配成功，rs的值为：{user-group-role,-}，同样对user,group,role的匹配也是成功的，但像user-group,role等就不对了。

33>/0：匹配一个NUL字符。

34>/xhh：匹配一个由两位16进制数字所表达的字符。

35>/uhhhh：匹配一个由四位16进制数字所表达的字符。

3，表达式操作

1）表达式操作，在这里是指和表达式相关的方法，我们将介绍六个方法。

2）表达式对象（RegExp）方法：

1>exec(str)，返回str中与表达式相匹配的第一个字符串，而且以数组的形式表现，当然如果表达式中含有捕捉用的小括号，则返回的数组中也可能含有()中的匹配字符串，例如：

var regx=//d+/;

var rs=regx.exec(“3432ddf53”);

返回的rs值为：{3432}

var regx2=new RegExp(“ab(/d+)c”);

var rs2=regx2.exec(“ab234c44”);

返回的rs值为：{ab234c,234}

In addition, if there are multiple suitable matches, exec is executed for the first time and exec is continued, the second and third matches are returned in turn. Por exemplo:

var regx=/user/d/g;

var rs=regx.exec(“ddduser1dsfuser2dd”);

var rs1=regx.exec(“ddduser1dsfuser2dd”);

则rs的值为{user1}，rs的值为{rs2}，当然注意regx中的g参数是必须的，否则无论exec执行多少次，都返回第一个匹配。后面还有相关内容涉及到对此想象的解释。

2>test(str), determines whether the string str matches the expression, and returns a boolean value. Por exemplo:

var regx=/user/d+/g;

var flag=regx.test(“user12dd”);

flag的值为true。

3）String对象方法

1>match(expr)，返回与expr相匹配的一个字符串数组，如果没有加参数g，则返回第一个匹配，加入参数g则返回所有的匹配

exemplo:

var regx=/user/d/g;