大数据先行者

    中国正处于大数据的起步阶段,国外先行者的经验对我们具有十分重要的参考和借鉴价值。全世界的富有远见者早在多年前就已经开始了你追我赶,在自己大数据中心的建设上各显神通,力争在这场战争中取得先发优势。

    ☆英特尔(Intel)

    英特尔公司是全球最大的半导体芯片制造商,成立于1968年,具有几十年产品创新和市场领导的历史。全球第一个微处理器就由它在1971年推出,从而引发了计算机和互联网革命。从硬件入手以配备大数据需求是英特尔首先做的准备,同时对于软件也毫不放松,在Hadoop系统、Hbase、HDFS上都做了增强和优化,并且推出了Intel Hadoop Manager 2.0。

    2012年7月,英特尔对外发布了自己的Hadoop商业发行版(Apache Hadoop Distribution),成为几家大型厂商中唯一拥有自身发行版Hadoop的公司。

    ☆IBM

    IBM以对数据挖掘和数据分析领域的收购展开了大数据时代的布局,后来正式推出名为“3A5步”的动态路线,然后结合信息管理、业务分析等软件提出了属于IBM的大数据平台架构。

    该公司的大数据架构涵盖了IBM在大数据领域的四大核心能力和相应的产品线,包括:Hadoop领域的InfoSphere BigInsights,流计算领域的InfoSphere Streams,数据仓库方面的InfoSphere Warehouse和etezza以及信息整合与治理(Information Integration and Governance)方面的产品Optim及Guardium。

    ☆Hortonworks

    2011年从雅虎剥离后,Hortonworks公司在当年8月份就发布了一款基于Hadoop的数据平台的技术预览版(Hortonworks Data Platform,HDP)。仅过几周,该公司又推出了基于Hadoop 0.23的HDP 2.0版本,该版本的Hadoop获得极大提升,实现了下一代的MapReduce。

    尽管成立时间很短,但Hortonworks行动迅速,就在IBM宣布了基于Hadoop的大数据分析平台后不久,它便开启了自己的大数据战略。此外,它还与Talend公司达成协议,将在其数据平台上提供给Talend公司 Open Studio for Big Data工具,以全面应对大数据处理。

    ☆微软(Microsoft Corporation)

    微软公司作为传统的IT业旗帜企业、当之无愧的垄断巨头,进入大数据领域看起来却并不是第一位的。它经常被人们认为起步较晚,但其实微软早在2006年就致力于研究类似Hadoop的开发计划Dryad,并使其获得产品化。微软一直保持自己的独特风格,不紧不慢,但从不在关键领域落后于人。

    2011年初,微软公司发布了自己的并行数据仓库项目(SQL)。一年后,正式发布了SQL Server 2012数据库平台,把业务延伸到了非结构化数据领域。当Windows Azure Marketplace和SharePoint等工具推出以后,微软公司厚积薄发,已完全具备了打造大数据平台的能力。

    ☆思爱普(SAP)

    成立于1972年的思爱普公司在软件领域一向具有极大的优势,而且其产品大多聚焦在对数据的分析能力上。这使它在大数据时代开启的一瞬间,就已处在领跑者的位置。2012年8月,思爱普推出了SAP BusinessObjects BI解决方案4.0版本的第三功能包,简称feature pack 3,随后又进行了改进整合。

    以SAP HANA为基础,思爱普还打造了强大的实时数据平台,为用户提供全面的数据分析和处理服务。

    ☆甲骨文(Oracle)

    自2009年收购Sun Microsystems公司(主要生产工作站和服务器)之后,甲骨文一直在进行硬件与软件的整合。该公司于2011年推出的大数据机(BDA)和Exalytics商务智能服务器,被认为是甲骨文强势进入大数据市场的标志。2012年初,正式供货的BDA和Exalytics预示甲骨文大数据平台解决方案的出台。

    2012年12月13日,甲骨文宣布收购服务于石油、电气、供水行业的DataRaker公司,标志着大数据应用达到了一个新的趋势,开始向传统行业渗透,产生深入和全面的应用效果。

    ☆威睿(VMware)

    威睿是全球桌面到数据中心虚拟化解决方案的领导厂商,它的虚拟化产品除了针对Hadoop进行优化外,还有围绕大数据分析和处理的项目。此外,Cetas和vFabric Data系列产品都降低了人们在进行数据处理分析时的复杂度。除了最为核心和拿手的虚拟化产品之外,威睿公司近几年也通过收购和自我研发推出了众多开源产品。比如HVE(Hadoop Virtualization Essential)的插件以及Serengeti的产品,都是威睿推出的开源的虚拟化产品。

    ☆Cloudera

    Cloudera公司由来自脸书(Facebook)、谷歌和雅虎的前工程师杰夫·哈默巴切(Jeff Hammerbacher)、克里斯托弗·比塞格利亚(Christophe Bisciglia)、埃姆·阿瓦达拉(Amr Awadallah)以及现任CEO、甲骨文前高管迈克·奥尔森(Mike Olson)在2008年创建。公司采用了NoSQL和Hadoop两种技术,由此获得了7600万美元的融资。

    在2010年6月份,该公司正式推出了自己的企业产品。随后,Cloudera为其Apache Hadoop软件发行版增添了Cloudera管理器控制台及企业级的支持。现在它也与甲骨文进行密切合作,互相增加客户数量,推动彼此在大数据市场的份额。

    ☆MapR

    MapR公司始终专注于可用性和数据安全的优化,它有自己的优势和独一无二的特性。比如,虽然和其他公司一样,MapR将基于开源的Hadoop产品商品化并进行销售,但它提供了很多不同于Hadoop的特性。它的产品为EMC的Greenplum HD企业版Hadoop提供技术支持。

    不久前,MapR公司宣布了新的大数据平台MapR M7,这将为Hadoop与NoSQL提供更为方便、可靠和快速的服务。

    ☆Splunk

    2003年成立并于2012年上市的美国商业智能软件提供商Splunk公司是公认的“大数据概念第一股”,它主要的业务就是向企业及客户提供数据引擎。它旗下的Machine Data软件的搜索功能具有强大的优势,而Splunk Free则专供个人用户使用,Splunk Enterprise则添加了支持多用户和分布式部署的功能。

    在上述产品大获成功以后,Splunk公司随即又推出新的Splunk for Citrix XenDesktop解决方案,并在2012年的中旬将Splunk App for PCI Compliance 2.0全面推向市场。