5.1.4 代码解读

WordCount程序在Map阶段接收输入的<key, value>(key是当前输入的行号,value是对应行的内容),然后对此行内容进行切词,每切下一个词就将其组织成<word,1>的形式输出,表示word出现了一次。

在Reduce阶段,TaskTracker会接收到<word,{1,1,1,1……}>形式的数据,也就是特定单词及其出现次数的情况,其中“1”表示word的频数。所以Reduce每接受一个<word,{1,1,1,1……}>,就会在word的频数上加1,最后组织成<word, sum>的形式直接输出。