4.6 网络用户界面

Hadoop自带的网络用户界面在查看工作的信息时很方便(在http://jobtracker-host:50030/中能找到用户界面)。在Job运行时,它对于跟踪Job工作进程很有用,同样在工作完成后查看工作统计和日志时也会很有用。

4.6.1 JobTracker页面

JobTracker页面主要包括五部分。

第一部分是Hadoop安装的详细信息,比如版本号、编译完成时间、JobTracker当前的运行状态和开始时间。

第二部分是集群的一个总结信息:集群容量(用集群上可用的Map和Reduce任务槽的数量表示)及使用情况、集群上运行的Map和Reduce的数量、提交的工作总量、当前可用的TaskTracker节点数和每个节点平均可用槽的数量。

第三部分是一个正在运行的工作日程表。打开能看到工作的序列。

第四部分显示的是正在运行、完成、失败的工作,这些显示信息通过表格来体现。表中每一行代表一个工作并且显示了工作的ID号、所属者、名字和进程信息。

最后一部分是页面的最下面JobTracker日志的链接和JobTracker的历史信息:JobTracker运行的所有工作信息。在将这些信息提交到历史页面之前,主要显示100个工作(可以通过mapred.job.name进行配置)。注意,历史记录是永久保存的,因此可以从JobTracker以前运行的工作中找到相关的记录。