9.3 本章小结

本章主要介绍了Spark程序的性能调优。在应用开发中首先应该是能够让程序运行,第二步才是在静态代码或者运行程序中诊断性能瓶颈,查找造成性能问题的代码或配置项,然后通过性能调优的原则指导Spark的调优,优化改进代码和配置项。过早的优化是万恶之源,在不恰当的时间进行优化会增加程序复杂性以及延缓开发周期。同时我们也看到大数据系统软件栈多,集群环境复杂,需要考虑更多的因素进行性能调优,这是挑战,同时也是机遇。