第4章

    分析可扩展性的演进

    不言而喻,大数据的世界需要更高层次的可扩展性。随着公司处理的数据量持续增长,原有的数据处理方法已经无法应对现有的数据量。那些没有更新技术以提供更高层次的可扩展性的企业,将无法应对大数据带来的数据处理压力。幸运的是,在大数据处理、分析与应用的不同层面中,有很多技术可供使用。其中有些技术还非常新,而大数据领域的公司也需要与时俱进。

    这一章会讨论能够帮助我们驾驭大数据的几种重要技术:分析与数据环境的关联性、海量并行处理架构(Massively Parallel Processing,MPP)、云计算、网格计算以及MapReduce。

    开始讲述具体内容以前,请记住本书的定位并不是一本技术书籍。这一章,以及随后的第5章与第6章,将会是技术性内容最多的章节,但是所有的技术内容都将局限在概念层面,以确保技术背景不深的读者也可以轻松地理解。为了达到这个目标,本书对某些技术细节进行了一定程度的简化处理。如果读者想了解更多的技术细节,可以阅读专注于技术本身的其他书籍。