拖车上的高密度运算

    2009年12月初,美国加州大学圣地亚哥分校发布了一份调查报告,列出在2008年美国人消费的数据量。这份报告显示,每个美国人平均每天消费34GB数据,且其中大部分是以数字形式传递和存储的。Gartner咨询公司认为,世界上的数据存储量以每年40%以上的速度递增,同时也带来了对计算能力的巨大需求。然而,更好的计算能力和更大的存储量往往会演变成高度复杂和高能耗的噩梦。最近引起热烈讨论的便携模块化数据中心(Portable Modular Data Centre),也许可以在开支和成本之间找到更好的平衡。

    在十几年前,当企业需要计算能力和网络服务时,往往会建设一个机房,通过独立的服务器来处理计算需求,完成数据传输的任务,并且将业务集中处理,以此来提升管理能力。随着需求的增加,独立的服务器被安装了多部服务器的机柜取代,机柜又会逐步增设,排列成行。同时,对这些机柜安全性和稳定性的要求又将进一步提高,更多的网络设备、线路和制冷设备也会纷纷安装。如今的服务器正向着体积更小而密度更高的方向发展,同时带来了更多的发热量——当每个机柜能耗超过15千瓦时,就需要引入水冷设备来降温,其复杂程度远非空气制冷所能比拟。能够提供更多服务和更强大性能的数据中心一般都需要相当精细的规划,从设计到投入使用往往需要一年以上的时间,以及可能上亿元的投资。

    所以,数据中心的能耗和复杂性往往很惊人。IBM在瑞士建设的数据中心使用水冷却系统,加热后的水可以供应一个室外游泳池的需要;谷歌甚至申请了一项海面下数据中心的专利,将集装箱数据中心装入罐子沉到水下,利用海浪发电供应能源,并且利用海水冷却。同时由于人们对数据服务依赖程度的增加,对数据中心的要求也变得越来越高,诸多IT大厂都已经开始将数据中心作为一个业务部门来运营,并且开展多项相关技术研发:从提高数据中心可持续运营的时间百分比到降低能源消耗,再到制冷装置应该如何运行才能更有效。随着能源价格的持续走高和IT产品成本的迅速降低,一个数据中心在运营三年后,其能源方面的开支将会超过设备开支。

    目前世界上大约有超过4400万台服务器,即便经济不景气,企业对于计算能力和存储的需求依然在增加。2009年第3季度,全球一共卖出190多万部服务器,总收入在100亿美元以上。然而和去年同期相比,销售数量下降了17%、收入下降了15%——企业们对增设数据中心开始变得更加谨慎,也开始追求性价比更高的存储及计算方式。

    在对数据中心的效率进行评估时,有一个叫做电力使用效率(PUE,Power Usage Effectiveness)的指标。这个指标是用来衡量总消耗电力与用于计算消耗的电力的比值,PUE越接近1,则说明数据中心的能源利用率越高。传统数据中心的PUE往往在2.5~3左右,其中大量的电力用于温度控制,而经过精心设计的数据中心,PUE也在1.6~1.7左右。但是,各大厂商推出的集装箱数据中心,可以将PUE降到1.25,以此来降低能源上的开销。

    从2006年升阳微系统公司提出关于集装箱数据中心的“黑盒子项目”后,惠普、IBM、戴尔、SGI、Rackable Systems等厂商都分别推出了自己的产品。所有设备都被塞进一个标准的20英尺长或40英尺长的集装箱中,通过精心的模块化设计,可以让其发挥很高的性能。惠普的40英尺集装箱数据中心能够容纳9600个计算核心和3500TB的存储量,相当于在这样一个12.2米长、2.4米宽和2.6米高的箱子里装入了传统370平方米数据中心能够容纳的设备。通过专利保护的水冷装置和机柜布局,每个机柜可以让27千瓦的设备保持正常工作,整个集装箱可以接入600千瓦的电力。而这样的数据中心可以在6周到12周内交货,用户只需要接入电路、冷却系统和网络连接就可以工作。

    集装箱数据中心和传统数据中心的区别,就像精装修房和毛坯房的区别一样。供应商可以将计算能力和存储能力打包销售,而用户只需要做些简单的设置就可以使用。很明显,这种能够快速部署的数据中心会受到那些业务量激增或者需要快速部署计算能力的客户的欢迎,例如飞速发展的Web 2.0网站,或者由信息化技术武装的军方用户。

    微软正在建设一个大型数据中心,使用了大约220个集装箱,以及超过44万台服务器。微软全球基础服务企业副总裁德伯拉·查拉帕蒂(Debra Chrapaty)认为,使用集装箱数据中心将会比建设传统的数据中心成本更低,而且其可以快速扩展的特性也很吸引人。但是毕竟像微软这样提供大规模服务的企业只是少数,能够与之相比的只有谷歌这样拥有上百万台服务器的搜索巨头。而对中小型企业,集装箱数据中心未必是最理想的选择。它提供的计算能力可能超过了企业的需求,在更新和维护时集装箱数据中心的狭小空间也会带来不便,而且这些数据中心一般不会支持其他第三方设备的安装。

    提供商们对此早有计划。IBM认为应该以“模块化”的方式构建数据中心,却不一定非得利用集装箱。IBM全球技术服务副总裁斯蒂夫·山姆斯(Steve Sams)说:“虽然我们是模块化数据中心的坚定支持者,但我们对于基于集装箱式数据中心的支持则有一定的保留。”他认为,在建筑物内同样可以部署高密度的计算能力,只要它是基于模块化设计就行,集装箱并非是必需的。

    的确,就像在个人电脑上,机箱也不是必须的一样。过去那种企业自行采购、自行建设的数据中心,就像我们自己去电脑城组装的兼容机,而模块化的数据中心就像品牌机——只是性能要强大得多罢了。