4.5.3　在集群上运行

接下来讲解程序如何在集群上运行。在笔者的实验环境中，一共有4台机器，其中一台同时担当JobTracker和NameNode的角色，但不担当TaskTracker和DataNode的角色，另外3台机器则同时担当Tasktracker和DataNode的角色。

首先，将输入的文件复制到HDFS中，用以下命令完成该功能：

hadoop dfs-copyFromLocal/home/u/Desktop/inputOfScoreProcessFinal inputOfScoreProcessFinal

下面，在命令行中运行程序：

～/hadoop-0.20.2/bin$hadoop jar/home/u/TG/ScoreProcessFinal.jar

ScoreProcessFinal inputOfScoreProcessFinal outputOfScoreProcessFinal

执行上述命令运行ScoreProcessFinal.jar中的ScoreProcessFinal类，并且将inputOf-ScoreProcessFinal作为输入，outputOfScoreProcessFinal作为输出。