20.3 XML文档
本节介绍如何编写XML文档,以及XML文档的结构形式。并且通过实例一步步讲解,让读者能真正掌握XML的精髓。
XML文档由实体(存储单元)组成,用来定义标记的标记语言,可用来定义自己所需要的标记集。HTML只支持英文标记,而XML可以支持多种语言的标记。
现在把整个文档进行划分,可以看出一个文档(包括HTML文档)总共分为三个部分,也可以说是三大要素,即文档数据、文档结构、文档样式。
下面以HTML为例分析文档的三要素。
<table border=2 align=center>……//文档样式
<caption>清华大学菜价表</caption>
……
<tr>
<td align=center>鱼香肉丝</td>
<td align=center>3.50</td>……//文档数据
……
</tr>
</table>……//文档结构
为了能够让XML的文档更具可读性,XML文档采取了数据与文档样式分离的原则。XML文档只提供数据,而XSL包括数据样式,文档的结构则使用DTD。DTD在后面的章节中详细介绍,而XSL则留待有兴趣的读者自行查阅资料。
20.3.1 XML的声明
XML声明就是宣布此文档是XML文档。那么如何进行声明呢?声明的语法如下所示。
<?xml版本信息(编码信息)(文档独立性信息)?>
下面分别解释每个元素的含义。
❑版本信息:是指XML目前使用的是1.0版还是1.1版,一般用1.0版本。
❑编码信息:就是指文档使用的是何种语言。如果使用中文,则可以通过下列方式表示。encoding=“gb2312”:如果不设定编码信息,默认使用英文。
❑文档独立性信息:文档独立指当前文档是否依赖外部文档。如果依赖可以通过下列方式表示:
standalone=“yes”,如果不独立,将其设置为“no”。
通过以上的介绍,下面举一个实例演示XML文档的声明。
<?xml version=1.0 encoding="gb2312"standalone="yes"?>