11.2 dom4j常用API
dom4j采用面向接口方式来解析XML文档,开发过程中所使用的API通常都是接口。dom4j树中各种节点的类图如图11.1所示:
图11.1 dom4j常用API接口
关于其中各接口的说明如表11.1所示。
表11.1 dom4j常用接口说明
除此之外,dom4j为解析XML文档提供了DOMReader、SAXReader、XPPReader和XPP3Reader 4个解析器,负责将不同形式的XML文档解析成dom4j树。
对应地,dom4j也提供了如下几个Writer:
DOMWriter:该输出工具类负责将dom4j树转换为W3C的DOM树。
SAXWriter:该输出工具类负责将dom4j树输出给SAX的ContentHandler处理。
XMLWriter:该工具类将dom4j树转换成对应的XML文档,并可输出到指定输出流中。
除此之外,如果程序需要创建一份新的Document,dom4j还提供了如下2个工具类:
DocumentFactory:该工具类提供了一个createDocument()方法用于创建Document对象。
DocumentHelper:该工具类提供了大量静态方法用于创建XML文档各组成部分。掌握了上述dom4j的常用API之后,下面就可以使用dom4j对XML文档进行实际访问了。
提示
dom4j除了提供XMLWriter之外,还提供了一个HTMLWriter,该工具类用于将dom4j树转换为对应的XHTML文档,并将该文档输出到指定输出流中。HTMLWriter与XMLWriter的不同之处在于:HTMLWriter会将CDATA和Entity都输出为文本。