正規表現を理解します
正規表現を使用したことがない場合は、この用語と概念にあまり精通していない場合があります。しかし、彼らはあなたが思うほど斬新ではありません。
ハードドライブでファイルを見つける方法を思い出してください。あなたは間違いなくあなたが探しているファイルを見つけるのを手伝ってください。文字はファイル名の単一の文字と一致し、 * 1つ以上の文字が一致します。 「データ?.dat」などのパターンは、次のファイルを見つけることができます。
data1.dat
data2.dat
datax.dat
datan.dat
*文字の代わりに使用される場合、見つかったファイルの数が拡張されます。 'data*.dat'は以下のすべてのファイル名と一致させることができます。
data.dat
data1.dat
data2.dat
data12.dat
datax.dat
dataxyz.dat
ファイルを検索するこの方法は確かに有用ですが、非常に限られています。の限られた能力と *ワイルドカードは、通常の表現ができることの概念を与えることができますが、正規表現はより強力で柔軟です。
正規表現の初期の起源
正規表現の祖先は、人間の神経系がどのように機能するかについての初期の研究にまでさかのぼることができます。 2人の神経生理学者であるWarren McCullochとWalter Pittsは、これらの神経ネットワークを説明する数学的な方法を開発しました。
1956年、スティーブン・クリーンという名前のアメリカの数学者が、マカロックとピッツの初期の研究に基づいたニューラルネットイベントの表記と題された論文を発表し、正規表現の概念を紹介しました。正規表現は、通常のセットを呼び出す代数を記述するために使用される式であるため、正規表現という用語が使用されます。
その後、UNIXの主な発明者であるKen Thompsonの計算検索アルゴリズムを使用して、この作業を初期の研究に適用できることが発見されました。正規表現の最初の実用的なアプリケーションは、UNIXのQEDエディターです。
彼らが言ったように、残っているのはよく知られている歴史です。それ以来、正規表現はテキストベースの編集者と検索ツールの重要な部分でした。
正規表現を使用します
典型的な検索および交換操作では、見つける正確なテキストを提供する必要があります。この手法は、静的テキストの単純な検索および交換タスクに十分な場合がありますが、柔軟性がないため、動的テキストを検索することは困難または不可能です。
正規表現を使用すると、次のことができます。
文字列のパターンをテストします。たとえば、入力文字列をテストして、文字列に電話番号パターンまたはクレジットカード番号パターンがあるかどうかを確認できます。これはデータ検証と呼ばれます。
テキストを交換します。ドキュメントで正規式を使用して特定のテキストを識別することができ、それをすべて削除したり、別のテキストに置き換えることができます。
パターンマッチングに従って、文字列からサブストリングを抽出します。テキストまたは入力フィールドで特定のテキストを見つけるために使用できます。
たとえば、時代遅れの素材を削除してHTMLのフォーマットタグを交換するためにWebサイト全体を検索する必要がある場合は、通常の式を使用して各ファイルをテストして、探している素材またはHTMLがそのファイル形式に存在するかどうかを確認できます。 。この方法により、影響を受けるファイルを削除または変更する資料を含むファイルに絞り込むことができます。次に、正規表現を使用して時代遅れの材料を削除できます。最後に、正規表現を再度使用して、交換する必要があるタグを見つけて置き換えることができます。