17.2.4 HICC

HICC作为Chukwa的子项目,其重要功能是可视化系统性能指标。HICC能够显示传统系统的度量数据,例如系统资源空闲比率、CPU的负载、磁盘写数据的速度,以及应用层的统计数据(如本地机器内map任务数、Hadoop块迁移数量等)等。HICC也能够显示使用每一个节点日志信息的SALSA作业执行模型状态机和Mochi可视化框架[1,2]。利用Chukwa可视化功能可以清楚看到集群中的作业是否在被均匀传播。HDFS对于读请求有很长的延迟,因此在执行交互查询工作时,反应会比较慢,而HICC抽取数据是使用批插入的方式向SQL数据库中插入通过MapReduce处理收集到的数据。MapReduce作业默认每5分钟执行一次,因此显示数据至少比实时慢5分钟。HICC也可以支持集群性能的调试和Hadoop作业执行的可视化等应用。在这些应用中,延迟并不是问题。目前,HICC不需要Chukwa的可靠性传输,但是它依赖于Chukwa收集数据和MapReduce处理数据。