Latest web development tutorials

正則表達式– 簡介

除非您以前使用過正則表達式,否則您可能不熟悉此術語。 但是,毫無疑問,您已經使用過不涉及腳本的某些正則表達式概念。

例如,您很可能使用? 和* 通配符來查找硬盤上的文件。 ? 通配符匹配文件名中的單個字符,而* 通配符匹配零個或多個字符。 像data?.dat 這樣的模式將查找下列文件:

data1.dat
data2.dat
datax.dat
dataN.dat

使用* 字符代替? 字符擴大了找到的文件的數量。 data*.dat 匹配下列所有文件:

data.dat
data1.dat
data2.dat
data12.dat
datax.dat
dataXYZ.dat

儘管這種搜索方法很有用,但它還是有限的。 通過理解* 通配符的工作原理,引入了正則表達式所依賴的概念,但正則表達式功能更強大,而且更加靈活。

正則表達式的使用,可以通過簡單的辦法來實現強大的功能。 下面先給出一個簡單的示例:

 ^.+@.+\\..+$ 

繼續閱讀本教程將讓您也可以自由應用這樣的代碼。

為什麼使用正則表達式?

典型的搜索和替換操作要求您提供與預期的搜索結果匹配的確切文本。 雖然這種技術對於對靜態文本執行簡單搜索和替換任務可能已經足夠了,但它缺乏靈活性,若採用這種方法搜索動態文本,即使不是不可能,至少也會變得很困難。

通過使用正則表達式,可以:

  • 測試字符串內的模式。
    例如,可以測試輸入字符串,以查看字符串內是否出現電話號碼模式或信用卡號碼模式。 這稱為數據驗證。
  • 替換文本。
    可以使用正則表達式來識別文檔中的特定文本,完全刪除該文本或者用其他文本替換它。
  • 基於模式匹配從字符串中提取子字符串。
    可以查找文檔內或輸入域內特定的文本。

例如,您可能需要搜索整個網站,刪除過時的材料,以及替換某些HTML 格式標記。 在這種情況下,可以使用正則表達式來確定在每個文件中是否出現該材料或該HTML 格式標記。 此過程將受影響的文件列表縮小到包含需要刪除或更改的材料的那些文件。 然後可以使用正則表達式來刪除過時的材料。 最後,可以使用正則表達式來搜索和替換標記。

發展歷史

正則表達式的"祖先"可以一直上溯至對人類神經系統如何工作的早期研究。 Warren McCulloch 和Walter Pitts 這兩位神經生理學家研究出一種數學方式來描述這些神經網絡。

1956 年, 一位叫Stephen Kleene 的數學家在McCulloch 和Pitts 早期工作的基礎上,發表了一篇標題為"神經網事件的表示法"的論文,引入了正則表達式的概念。 正則表達式就是用來描述他稱為"正則集的代數"的表達式,因此採用"正則表達式"這個術語。

隨後,發現可以將這一工作應用於使用Ken Thompson 的計算搜索算法的一些早期研究,Ken Thompson 是Unix 的主要發明人。 正則表達式的第一個實用應用程序就是Unix 中的qed 編輯器。

如他們所說,剩下的就是眾所周知的歷史了。 從那時起直至現在正則表達式都是基於文本的編輯器和搜索工具中的一個重要部分。

應用領域

目前,正則表達式已經在很多軟件中得到廣泛的應用,包括*nix(Linux, Unix等)、HP 等操作系統,PHP、C#、Java 等開發環境,以及很多的應用軟件中,都可以看到正則表達式的影子。

C# 正則表達式

在我們的C#教程中, C#正則表達式這一章節專門介紹了有關C#正則表達式的知識。

Java 正則表達式

在我們的Java教程中, Java正則表達式這一章節專門介紹了有關Java正則表達式的知識。

JavaScript 正則表達式

在我們的JavaScript教程中, JavaScript RegExp對像這一章節專門介紹了有關JavaScript正則表達式的知識,同時我們還提供了完整的JavaScript RegExp對象參考手冊

Python 正則表達式

在我們的Python基礎教程中, Python正則表達式這一章節專門介紹了有關Python正則表達式的知識。

Ruby 正則表達式

在我們的Ruby教程中, Ruby正則表達式這一章節專門介紹了有關Ruby正則表達式的知識。