4.5.3 在集群上运行
接下来讲解程序如何在集群上运行。在笔者的实验环境中,一共有4台机器,其中一台同时担当JobTracker和NameNode的角色,但不担当TaskTracker和DataNode的角色,另外3台机器则同时担当Tasktracker和DataNode的角色。
首先,将输入的文件复制到HDFS中,用以下命令完成该功能:
hadoop dfs-copyFromLocal/home/u/Desktop/inputOfScoreProcessFinal inputOfScoreProcessFinal
下面,在命令行中运行程序:
~/hadoop-0.20.2/bin$hadoop jar/home/u/TG/ScoreProcessFinal.jar
ScoreProcessFinal inputOfScoreProcessFinal outputOfScoreProcessFinal
执行上述命令运行ScoreProcessFinal.jar中的ScoreProcessFinal类,并且将inputOf-ScoreProcessFinal作为输入,outputOfScoreProcessFinal作为输出。