简介

    长期以来,应用数据一直被“禁锢”。最初,这些数据被局限在世界各地“孤立”运行的系统中。CAT-5以太网络、IP、路由器、DNS和Sockets诞生之后,机器之间开始能够互相连接。机器间的互通使得数据可以在应用程序之间自由传输,最终这些数据也变得更加有意思。数据超出了其原始的应用程序范围,开始进入各种各样的新场景之中。一夜之间,随着互联网的兴起,客户端-服务器计算得到了迅速发展,那些“孤立”的计算机突然之间互相连接在了一起。以HTTP做为通信媒介和文本作为语言,数据“流动”了起来。

    在过去大约15年里,主要的数据流可分为两类:色情和普通的消费商务(包括通过代理的广告),二者都很好地遵从20世纪90年代初期兴起的传统的由“Web浏览器”以及相应的服务器所构成的数据传送模型。最近,第三类数据——社交数据开始兴起。人们开始把自己的社交移到网络上,这创造了新的数据类型,以及新的不完全遵循基于浏览器模式的访问需求。社交数据就在这里,而且对它的需求正当其时。2009年1月14日的PEW报告《Adults and Social Network Websites》指出,18~34岁的在线成年人,50%以上有自己的社交网络个人信息[1]

    在本章中,我将讨论这一演变过程以及消费趋势信息即社交数据的内在问题的当前解决方案。虽然我们已经经历了跨越式发展,但这过程中丢失了一些基本的编程原则:事件驱动的体系结构和数据结构的可预测性。通常,当前问题的解决方案就在眼前,而且“奥卡姆剃刀”(Ocam's razor)理论也表明这些解决方法通常很简单。真正通过180角度HTTP转换并采用POST方法,“实时”可以正式成为社交数据词汇的一部分。作为中介,Gnip(http://www.gnip.com)在异构社交数据和消费应用之间架起了便捷的桥梁。

    [1]http://www.pewinternet.org/Reports/2009/Adults-and-Social-Network-Websites.aspx