20.3 XML文档

本节介绍如何编写XML文档,以及XML文档的结构形式。并且通过实例一步步讲解,让读者能真正掌握XML的精髓。

XML文档由实体(存储单元)组成,用来定义标记的标记语言,可用来定义自己所需要的标记集。HTML只支持英文标记,而XML可以支持多种语言的标记。

现在把整个文档进行划分,可以看出一个文档(包括HTML文档)总共分为三个部分,也可以说是三大要素,即文档数据、文档结构、文档样式。

下面以HTML为例分析文档的三要素。


<table border=2 align=center>……//文档样式

<caption>清华大学菜价表</caption>

……

<tr>

<td align=center>鱼香肉丝</td>

<td align=center>3.50</td>……//文档数据

……

</tr>

</table>……//文档结构


为了能够让XML的文档更具可读性,XML文档采取了数据与文档样式分离的原则。XML文档只提供数据,而XSL包括数据样式,文档的结构则使用DTD。DTD在后面的章节中详细介绍,而XSL则留待有兴趣的读者自行查阅资料。

20.3.1 XML的声明

XML声明就是宣布此文档是XML文档。那么如何进行声明呢?声明的语法如下所示。


<?xml版本信息(编码信息)(文档独立性信息)?>


下面分别解释每个元素的含义。

❑版本信息:是指XML目前使用的是1.0版还是1.1版,一般用1.0版本。

❑编码信息:就是指文档使用的是何种语言。如果使用中文,则可以通过下列方式表示。encoding=“gb2312”:如果不设定编码信息,默认使用英文。

❑文档独立性信息:文档独立指当前文档是否依赖外部文档。如果依赖可以通过下列方式表示:

standalone=“yes”,如果不独立,将其设置为“no”。

通过以上的介绍,下面举一个实例演示XML文档的声明。


<?xml version=1.0 encoding="gb2312"standalone="yes"?>