Comprender las expresiones regulares
Si nunca ha usado expresiones regulares, puede estar menos familiarizado con este término y concepto. Sin embargo, no son tan novedosos como crees.
Recuerde cómo encontrar archivos en su disco duro. Definitivamente usará los caracteres y * para ayudar a encontrar el archivo que está buscando. ? Los caracteres coinciden con un solo personaje en el nombre del archivo, mientras * coincide con uno o más caracteres. Un patrón como 'Data? .Dat' puede encontrar el siguiente archivo:
data1.dat
Data2.dat
datax.dat
datan.dat
Si el * carácter se usa en lugar del personaje, el número de archivos encontrados se expandirá. 'Data*.dat' puede coincidir con todos los nombres de archivo a continuación:
data.dat
data1.dat
Data2.dat
datos12.dat
datax.dat
dataxyz.dat
Aunque este método de búsqueda de archivos es ciertamente útil, también es muy limitado. La capacidad limitada de?
Orígenes tempranos de expresiones regulares
Los antepasados de las expresiones regulares se remontan a los primeros estudios sobre cómo funciona el sistema nervioso humano. Warren McCulloch y Walter Pitts, dos neurofisiólogos, han desarrollado una forma matemática de describir estas redes neuronales.
En 1956, un matemático estadounidense llamado Stephen Kleene publicó un artículo titulado Notación de eventos de red neuronal basada en el trabajo temprano de McCulloch y Pitts, introduciendo el concepto de expresiones regulares. Las expresiones regulares son expresiones utilizadas para describir álgebras que llama conjuntos regulares, por lo que se usa el término expresión regular.
Posteriormente se descubrió que este trabajo podría aplicarse a algunas investigaciones tempranas utilizando el algoritmo de búsqueda computacional de Ken Thompson, el principal inventor de Unix. La primera aplicación práctica para expresiones regulares es el editor QED en Unix.
Como dijeron, lo que queda es una historia bien conocida. Las expresiones regulares han sido una parte importante de los editores y herramientas de búsqueda basadas en texto desde entonces.
Usando expresiones regulares
En las operaciones típicas de búsqueda y reemplazo, se debe proporcionar el texto exacto que se encuentra. Esta técnica puede ser suficiente para tareas simples de búsqueda y reemplazo en texto estático, pero debido a su falta de flexibilidad, es difícil o incluso imposible buscar texto dinámico.
Usando expresiones regulares, puede:
Prueba un patrón de una cadena. Por ejemplo, puede probar una cadena de entrada para ver si hay un patrón de número de teléfono o un patrón de número de tarjeta de crédito en la cadena. Esto se llama validación de datos.
Reemplazar texto. Puede usar una expresión regular en un documento para identificar un texto específico, y luego puede eliminarlo todo o reemplazarla con otro texto.
Extraiga una subcadena de la cadena de acuerdo con la coincidencia de patrones. Se puede usar para encontrar texto específico en texto o campos de entrada.
Por ejemplo, si necesita buscar en todo el sitio web para eliminar un material obsoleto y reemplazar algunas etiquetas de formato HTML, puede probar cada archivo utilizando expresiones regulares para ver si el material o HTML que está buscando existe en ese formato de archivo. . Este método le permite reducir los archivos afectados a aquellos archivos que contienen el material que desea eliminar o cambiar. Luego puede usar expresiones regulares para eliminar materiales obsoletos y, finalmente, puede usar expresiones regulares nuevamente para encontrar y reemplazar las etiquetas que deben reemplazarse.