第11章 Hive详解

本章内容

Hive简介

Hive的基本操作

Hive QL详解

Hive网络(Web UI)接口

Hive的JDBC接口

Hive的优化

本章小结

Hive是Hadoop中的一个重要子项目,它利用的是MapReduce编程技术,实现了部分SQL语句,提供了类SQL的编程接口。Hive的出现极大地推进了Hadoop在数据仓库方面的发展。事实上,目前业界仍在对何谓大规模数据分析最佳方法进行着辩论。由于传统应用的惯性,业界保守派依然青睐于关系型数据库和SQL语言。而在学术界,互联网阵营则更集中于支持MapReduce的开发模式。本章我们将对基于Hive的数据仓库解决方案进行介绍。