0
正規表現のデータマイニングとパーサー。正規表現の抽出では、正規表現に基づいてテキストから用語を抽出できます。独自の正規表現を作成したり、組み込み式(電子メール、URI、URL、米国住所、米国郵便番号、クレジットカード、電話番号、日付など)を使用したり、多くのサイトから正規表現を取得したりできます。コンピューティングでは、正規表現は、特定の文字、単語、または文字のパターンなどのテキスト文字列を「一致」(指定および認識)するための簡潔で柔軟な手段を提供します。「正規表現」の略語には「regex」と「regexp」が含まれます。正規表現は、正規表現プロセッサーで解釈できる形式言語で記述されます。正規表現プロセッサーは、パーサージェネレーターとして機能するか、テキストを調べて指定された仕様に一致する部分を識別するプログラムです。歴史的に、正規表現の概念は、1950年代に導入されたKleeneの正規集合の形式に関連しています。...正規表現で表現できる仕様の例を次に示します。、「car」、「cartoon」、または「bicarbonate」などの文字列「car」は、「Icelander」または「chandler」などの「car」という単語の間に他の文字とその順序で発生します単語「car」の前に単語「car」、単語「car」の前に単語「motor」、ドル記号の直後に1つ以上の数字が続き、その後オプションで単語「car」が表示されます。ピリオドとさらに2桁の数字(「$ 100」または「$ 245.99」など)。これらの例は単純です。非常に複雑な仕様は、正規表現で伝えることができます。正規表現は、Perl、Ruby、AWK、Tclなどの多くの言語で使用されており、正規表現をコア言語自体の構文に統合しています。.NET言語、Java、Pythonのような他のプログラミング言語ではなくpr
extract-regex