11.2.1 Lucene的组成结构

Lucene由Core和Sandbox两部分组成,其中Core是Lucene最核心、最稳定的部分,Sandbox包含了Lucene的一些附加功能,如关键字高亮显示、索引浏览器、其他各种语言分析器等。

Lucene Core由7个包组成,包括analysis、document、index、queryParser、search、store和util,如图11-2所示。

11.2.1 Lucene的组成结构 - 图1

图11-2 Lucene的核心结构

从图11-2可以清楚地看到,Lucene Core由基础结构封装、索引核心和对外接口三部分组成。图中7个包的功能描述如表11-1所示。

表11-1 Lucene Core中各包的功能描述

11.2.1 Lucene的组成结构 - 图2

Lucene的功能很强大,但从根本上来说,主要包括索引和检索两个核心功能。索引是全文检索的核心,建立索引就是把待检索的数据资源处理成方便查询的索引文件的过程。当索引创建完成后,就可以在索引上做检索。Lucene首先会对用户的查询关键词进行解析,然后从索引文件中进行查找,最终返回与用户输入的关键词相匹配的文档。