PHP 過濾器
PHP 過濾器用於驗證和過濾來自非安全來源的數據,比如用戶的輸入。
什麼是PHP 過濾器?
PHP 過濾器用於驗證和過濾來自非安全來源的數據。
測試、驗證和過濾用戶輸入或自定義數據是任何Web 應用程序的重要組成部分。
PHP 的過濾器擴展的設計目的是使數據過濾更輕鬆快捷。
為什麼使用過濾器?
幾乎所有的Web 應用程序都依賴外部的輸入。 這些數據通常來自用戶或其他應用程序(比如web 服務)。 通過使用過濾器,您能夠確保應用程序獲得正確的輸入類型。
您應該始終對外部數據進行過濾!
輸入過濾是最重要的應用程序安全課題之一。
什麼是外部數據?
- 來自表單的輸入數據
- Cookies
- Web services data
- 服務器變量
- 數據庫查詢結果
函數和過濾器
如需過濾變量,請使用下面的過濾器函數之一:
- filter_var() - 通過一個指定的過濾器來過濾單一的變量
- filter_var_array() - 通過相同的或不同的過濾器來過濾多個變量
- filter_input - 獲取一個輸入變量,並對它進行過濾
- filter_input_array - 獲取多個輸入變量,並通過相同的或不同的過濾器對它們進行過濾
在下面的實例中,我們用filter_var() 函數驗證了一個整數:
<?php $int = 123; if(!filter_var($int, FILTER_VALIDATE_INT)) { echo("不是一个合法的整数"); } else { echo("是个合法的整数"); } ?>
上面的代碼使用了"FILTER_VALIDATE_INT" 過濾器來過濾變量。 由於這個整數是合法的,因此上面的代碼將輸出:
如果我們嘗試使用一個非整數的變量(比如"123abc"),則將輸出:"Integer is not valid"。
如需查看完整的函數和過濾器列表,請訪問我們的PHP Filter參考手冊 。
Validating 和Sanitizing
有兩種過濾器:
Validating 過濾器:
- 用於驗證用戶輸入
- 嚴格的格式規則(比如URL 或E-Mail 驗證)
- 如果成功則返回預期的類型,如果失敗則返回FALSE
Sanitizing 過濾器:
- 用於允許或禁止字符串中指定的字符
- 無數據格式規則
- 始終返回字符串
選項和標誌
選項和標誌用於向指定的過濾器添加額外的過濾選項。
不同的過濾器有不同的選項和標誌。
在下面的實例中,我們用filter_var() 和"min_range" 以及"max_range" 選項驗證了一個整數:
<?php $var=300; $int_options = array( "options"=>array ( "min_range"=>0, "max_range"=>256 ) ); if(!filter_var($var, FILTER_VALIDATE_INT, $int_options)) { echo("不是一个合法的整数"); } else { echo("是个合法的整数"); } ?>
就像上面的代碼一樣,選項必須放入一個名為"options" 的相關數組中。 如果使用標誌,則不需在數組內。
由於整數是"300",它不在指定的範圍內,以上代碼的輸出將是:
不是一个合法的整数
如需查看完整的函數和過濾器列表,請訪問我們的PHP Filter參考手冊 。 您可以看到每個過濾器的可用選項和標誌。
驗證輸入
讓我們試著驗證來自表單的輸入。
我們需要做的第一件事情是確認是否存在我們正在查找的輸入數據。
然後我們用filter_input() 函數過濾輸入的數據。
在下面的實例中,輸入變量"email" 被傳到PHP 頁面:
<?php if(!filter_has_var(INPUT_GET, "email")) { echo("没有 email 参数"); } else { if (!filter_input(INPUT_GET, "email", FILTER_VALIDATE_EMAIL)) { echo "不是一个合法的 E-Mail"; } else { echo "是一个合法的 E-Mail"; } } ?>
以上實例測試結果如下:
實例解釋
上面的實例有一個通過"GET" 方法傳送的輸入變量(email):
- 檢測是否存在"GET" 類型的"email" 輸入變量
- 如果存在輸入變量,檢測它是否是有效的e-mail 地址
淨化輸入
讓我們試著清理一下從表單傳來的URL。
首先,我們要確認是否存在我們正在查找的輸入數據。
然後,我們用filter_input() 函數來淨化輸入數據。
在下面的實例中,輸入變量"url" 被傳到PHP 頁面:
<?php if(!filter_has_var(INPUT_GET, "url")) { echo("没有 url 参数"); } else { $url = filter_input(INPUT_GET, "url", FILTER_SANITIZE_URL); echo $url; } ?>
實例解釋
上面的實例有一個通過"GET" 方法傳送的輸入變量(url):
- 檢測是否存在"GET" 類型的"url" 輸入變量
- 如果存在此輸入變量,對其進行淨化(刪除非法字符),並將其存儲在$url 變量中
假如輸入變量是一個類似這樣的字符串:"http://www.ruaanoob.com/",則淨化後的$url 變量如下所示:
過濾多個輸入
表單通常由多個輸入字段組成。 為了避免對filter_var 或filter_input 函數重複調用,我們可以使用filter_var_array 或the filter_input_array 函數。
在本例中,我們使用filter_input_array() 函數來過濾三個GET 變量。 接收到的GET 變量是一個名字、一個年齡以及一個e-mail 地址:
<?php $filters = array ( "name" => array ( "filter"=>FILTER_SANITIZE_STRING ), "age" => array ( "filter"=>FILTER_VALIDATE_INT, "options"=>array ( "min_range"=>1, "max_range"=>120 ) ), "email"=> FILTER_VALIDATE_EMAIL ); $result = filter_input_array(INPUT_GET, $filters); if (!$result["age"]) { echo("年龄必须在 1 到 120 之间。<br>"); } elseif(!$result["email"]) { echo("E-Mail 不合法<br>"); } else { echo("输入正确"); } ?>
實例解釋
上面的實例有三個通過"GET" 方法傳送的輸入變量(name、age 和email):
- 設置一個數組,其中包含了輸入變量的名稱和用於指定的輸入變量的過濾器
- 調用filter_input_array() 函數,參數包括GET 輸入變量及剛才設置的數組
- 檢測$result 變量中的"age" 和"email" 變量是否有非法的輸入。 (如果存在非法輸入,在使用filter_input_array() 函數之後,輸入變量為FALSE。)
filter_input_array() 函數的第二個參數可以是數組或單一過濾器的ID。
如果該參數是單一過濾器的ID,那麼這個指定的過濾器會過濾輸入數組中所有的值。
如果該參數是一個數組,那麼此數組必須遵循下面的規則:
- 必須是一個關聯數組,其中包含的輸入變量是數組的鍵(比如"age" 輸入變量)
- 此數組的值必須是過濾器的ID ,或者是規定了過濾器、標誌和選項的數組
使用Filter Callback
通過使用FILTER_CALLBACK 過濾器,可以調用自定義的函數,把它作為一個過濾器來使用。 這樣,我們就擁有了數據過濾的完全控制權。
您可以創建自己的自定義函數,也可以使用已存在的PHP 函數。
將您準備用到的過濾器的函數,按指定選項的規定方法進行規定。 在關聯數組中,帶有名稱"options"。
在下面的實例中,我們使用了一個自定義的函數把所有"_" 轉換為空格:
<?php function convertSpace($string) { return str_replace("_", ".", $string); } $string = "www_w3big_com!"; echo filter_var($string, FILTER_CALLBACK, array("options"=>"convertSpace")); ?>
上面代碼的結果如下所示:
實例解釋
上面的實例把所有"_" 轉換成"." :
- 創建一個把"_" 替換為"." 的函數
- 調用filter_var() 函數,它的參數是FILTER_CALLBACK 過濾器以及包含我們的函數的數組