第3章 MapReduce计算模型

本章内容

为什么要用MapReduce

MapReduce计算模型

MapReduce任务的优化

Hadoop流

Hadoop Pipes

本章小结

2004年,Google发表了一篇论文,向全世界的人们介绍了MapReduce。现在已经到处都有人在谈论MapReduce(微软、雅虎等大公司也不例外)。在Google发表论文时,MapReduce的最大成就是重写了Google的索引文件系统。而现在,谁也不知道它还会取得多大的成就。MapReduce被广泛地应用于日志分析、海量数据排序、在海量数据中查找特定模式等场景中。Hadoop根据Google的论文实现了MapReduce这个编程框架,并将源代码完全贡献了出来。本章就是要向大家介绍MapReduce这个流行的编程框架。