top
Loading...
DTD 構建模塊

DTD - XML 構建模塊


XML 和 HTML文檔的主要的構建模塊是元素標籤。


XML 文檔構建模塊

所有的 XML 文檔(以及 HTML 文檔)均由以下簡單的構建模塊構成:

  • 元素
  • 屬性
  • 實體
  • PCDATA
  • CDATA

元素

元素是 XML 以及 HTML 文檔的主要構建模塊

HTML 元素的例子是 "body" 和 "table"。XML 元素的例子是 "note" 和 "message" 。元素可包含文本、其他元素或者是空的。空的 HTML 元素的例子是 "hr"、"br" 以及 "img"。

實例:

<body>some text</body>

<message>some text</message>


屬性可提供有關元素的額外信息

屬性總是被置於某元素的開始標籤中。屬性總是以名稱/值的形式成對出現的。下面的 "img" 元素擁有關於源文件的額外信息:

<img src="computer.gif" />

元素的名稱是 "img"。屬性的名稱是 "src"。屬性的值是 "computer.gif"。由於元素本身為空,它被一個 " /" 關閉。


實體

實體是用來定義普通文本的變量。實體引用是對實體的引用。

大多數同學都了解這個 HTML 實體引用:"&nbsp;"。這個"無折行空格"實體在 HTML 中被用於在某個文檔中插入一個額外的空格。

當文檔被 XML 解析器解析時,實體就會被展開。

實體引用 字符
&lt; <
&gt; >
&amp; &
&quot; "
&apos; '
 

PCDATA

PCDATA 的意思是被解析的字符數據(parsed character data)。

可把字符數據想象為 XML 元素的開始標籤與結束標籤之間的文本。

PCDATA 是會被解析器解析的文本。這些文本將被解析器檢查實體以及標記。

文本中的標籤會被當作標記來處理,而實體會被展開。

不過,被解析的字符數據不應當包含任何 &、< 或者 > 字符;需要使用 &amp;、&lt; 以及 &gt; 實體來分別替換它們。


CDATA

CDATA 的意思是字符數據(character data)。

CDATA 是不會被解析器解析的文本。在這些文本中的標籤不會被當作標記來對待,其中的實體也不會被展開。

北斗有巢氏 有巢氏北斗