DTD 構建模塊
構建模塊最主要的與元素是XML 和HTML文檔。
XML 文檔構建模塊
所有的XML 文檔(以及HTML 文檔)均由以下簡單的構建模塊構成:
- Elements
- Attributes
- Entities
- PCDATA
- CDATA
元素
元素是XML以及HTML文檔的主要構建模塊 。
HTML 元素的例子是"body" 和"table"。 XML 元素的例子是"note" 和"message" 。 元素可包含文本、其他元素或者是空的。 空的HTML 元素的例子是"hr"、"br" 以及"img"。
實例:
<message>some text</message>
屬性可提供有關元素的額外信息 。
屬性總是被置於某元素的開始標籤中。 屬性總是以名稱/值的形式成對出現的。 下面的"img" 元素擁有關於源文件的額外信息:
元素的名稱是"img"。 屬性的名稱是"src"。 屬性的值是"computer.gif"。 由於元素本身為空,它被一個" /" 關閉。
實體
實體是用來定義普通文本的變量。 實體引用是對實體的引用。
大多數同學都了解這個HTML 實體引用:" "。 這個"無折行空格"實體在HTML 中被用於在某個文檔中插入一個額外的空格。
當文檔被XML 解析器解析時,實體就會被展開。
實體應用 | 字符 |
---|---|
< | < |
> | > |
& | & |
" | " |
' | ' |
PCDATA
PCDATA 的意思是被解析的字符數據(parsed character data)。
可把字符數據想像為XML 元素的開始標籤與結束標籤之間的文本。
PCDATA是會被解析器解析的文本。 這些文本將被解析器檢查實體以及標記。
文本中的標籤會被當作標記來處理,而實體會被展開。
不過,被解析的字符數據不應當包含任何&、< 或者> 字符;需要使用&、< 以及> 實體來分別替換它們。
CDATA
CDATA 的意思是字符數據(character data)。
CDATA是不會被解析器解析的文本。 在這些文本中的標籤不會被當作標記來對待,其中的實體也不會被展開。