第7章 Benchmark使用详解
Benchmark作为一种评价方式,在整个计算机领域有着长期的应用。在维基百科上的解释是“As computer architecture dvanced,it became more difficult to compare the performance of various computer systems simply by looking at their specifications.Therefore,tests were developed that allowed comparison of different architectures.”Benchmark在计算机领域应用最成功的就是性能测试,主要测试负载的执行时间、传输速度、吞吐量、资源占用率等。
大数据领域Benchmark标准尚未统一,生产环境和科研实验室迫切需要大数据Benchmark进行基准测试,对大数据分析系统选型和系统二次开发进行指导。Spark刚刚兴起,针对Spark进行开发的Benchmark还不多,用户可以根据自己的需求进行Benchmark选型,并可以借鉴其他Benchmark的数据生成器生成数据集,开发相应的典型工作负载完成对Spark的基准测试,诊断系统问题,更好地进行应用开发和系统二次开发。