4.6.3 返回结果

执行完任务后,可以通过以下几种方式得到结果。

1)通过命令行直接显示输出文件夹中的文件。

命令行如下:


hadoop dfs-ls outputOfScoreProcessFinal


通过以上命令的执行结果可以发现,输出的结果中一共有6个文件,分别是part-r-00000到part-r-00005。还可以具体显示每个文件中的内容,例如要显示part-r-00000中的内容,命令如下:


hadoop dfs-cat outputOfScoreProcessFinal/part-r-00000


2)将输出的文件从HDFS复制到本地文件系统上,在本地文件系统上查看。

命令如下:


hadoop dfs-get outputOfScoreProcessFinal/*/home/u/outputOfScoreProcessFinal


上述命令的主要功能是将HDFS中目录outputOfScoreProcessFinal下的所有文件复制到本地文件系统的目录/home/u/outputOfScoreProcessFinal下,然后就可以方便地进行查看了。

另外还可以在命令行中将输出文件part-r-00000到part-r-00005合并成一个文件,并复制到本地文件系统中。下面就是在命令行中进行的操作:


hadoop dfs-getmerge outputOfScoreProcessFinal/home/u/outputScore


上述命令的功能就是,将HDFS中目录outputOfScoreProcessFinal下的所有文件(即part-r-00000到part-r-00005)进行合并,然后复制到本地文件系统中的目录/home/u/outputScore下。

3)通过Web界面查看输出的结果。

通过浏览器访问集群的NameNode界面,点击页面上的“Browse the filesystem”即可看到HDFS中的内容,依次点击home、u、outputOfScoreProcessFinal,就可以看到程序的输出文件,再点击各个具体的输出文件可以查看输出内容。