第3章 MapReduce计算模型
本章内容
为什么要用MapReduce
MapReduce计算模型
MapReduce任务的优化
Hadoop流
Hadoop Pipes
本章小结
2004年,Google发表了一篇论文,向全世界的人们介绍了MapReduce。现在已经到处都有人在谈论MapReduce(微软、雅虎等大公司也不例外)。在Google发表论文时,MapReduce的最大成就是重写了Google的索引文件系统。而现在,谁也不知道它还会取得多大的成就。MapReduce被广泛地应用于日志分析、海量数据排序、在海量数据中查找特定模式等场景中。Hadoop根据Google的论文实现了MapReduce这个编程框架,并将源代码完全贡献了出来。本章就是要向大家介绍MapReduce这个流行的编程框架。