第2节 大数据时代

    人类的日常行为模式不是随机的,而是具有“爆发性”的。

    ——巴拉巴西《爆发:大数据时代预见未来的新思维》

    两个数据化的神奇案例

    随着互联网发展、移动互联网的兴起、互动式社会化自媒体时代的到来,线下和线上的互动带来海量数据,这些海量数据包含着很多有真正价值的数据,而这些有价值的数据其实越来越深刻影响到企业运营的方法论和运营的效率。在未来,我个人认为,关注数据的本质和挖掘数据的价值,几乎是企业中未来各部门职员,特别是营销部门、运营部门和产品部门必修的课程和技能,而不再是通过MBA案例和咨询专家简单来谈谈的问题了。

    关于数据化的神奇案例,流行最广的有两例:其一是“啤酒与尿布”的故事;其二是“塔吉特孕妇”的故事。

    啤酒与尿布

    我们先讲讲“啤酒与尿布”的故事,这个故事可以说是营销界的经典段子。打开Google搜索,会发现很多人都在津津乐道“啤酒与尿布”,可以说100个人就有100个版本的“啤酒与尿布”的故事。故事的时间跨度从20世纪80年代到本世纪初,甚至连故事的主角和地点都会发生变化——从美国跨越到欧洲。认真地查了一下资料会发现,沃尔玛的“啤酒与尿布”案例正式刊登在1998年的《哈佛商业评论》上,这应该算是目前发现的最权威报道。

    20世纪90年代,在美国沃尔玛超市中,超市管理人员分析销售数据时发现了一个令人难于理解的现象:在某些特定的情况下,“啤酒”与“尿布”两件看上去毫无关系的商品会经常出现在同一个购物篮中,这种独特的销售现象引起了管理人员的注意,经过后续调查发现,这种现象出现在年轻的父亲身上。在美国有婴儿的家庭中,一般是母亲在家中照看婴儿,年轻的父亲前去超市购买尿布。父亲在购买尿布的同时,往往会顺便为自己购买啤酒,这样就会出现啤酒与尿布这两件看上去不相干的商品经常会出现在同一个购物篮的现象。如果这个年轻的父亲在卖场只能买到两件商品之一,则他很有可能会放弃在这商店购物而到另一家商店,直到可以同时买到啤酒与尿布为止。沃尔玛发现了这一独特的现象,开始在卖场尝试将啤酒与尿布摆放在相同的区域,让年轻的父亲可以同时找到这两件商品,并很快地完成购物;而沃尔玛超市也可以让这些客户一次购买两件商品、而不是一件,从而获得了很好的商品销售收入,这就是“啤酒与尿布”的故事。

    当然“啤酒与尿布”的故事必须具有技术方面的支持。1993年美国学者Agrawal提出通过分析购物篮中的商品集合,从而找出商品之间关联关系的关联算法,并根据商品之间的关系,找出客户的购买行为的规律。Agrawal从数学及计算机算法角度提出了商品关联关系的计算方法——Aprior算法[1]。沃尔玛在20世纪90年代尝试将Aprior算法引入到POS机数据分析中,并获得了成功,于是产生了“啤酒与尿布”的故事。

    “啤酒与尿布”的故事对我个人的影响也很大,促使我选择了和数据相关的职业,一直到今天,我还在为公司的数据分析而绞尽脑汁。

    塔吉特孕妇

    下面我们讲讲第二个案例——“塔吉特孕妇”的故事,这个故事发生在美国第二大超市塔吉特百货(Target)。孕妇对于零售商来说是个含金量很高的顾客群体。但是他们一般会去专门的孕妇商店而不是在Target购买孕期用品。人们一提起Target,往往想到的都是清洁用品、袜子和手纸之类的日常生活用品,却忽视了Target有孕妇需要的一切。那么Target有什么办法可以把这部分细分顾客从孕妇产品专卖店的手里截留下来呢?

    为此,Target的市场营销人员求助于Target的顾客数据分析部(Guest Data&Analytical Services)的高级经理Andrew Pole,要求他建立一个模型,在孕妇第2个妊娠期就把她们给确认出来。在美国出生记录是公开的,等孩子出生了,新生儿母亲就会被铺天盖地的产品优惠广告包围,那时候Target再行动就晚了,因此必须赶在孕妇第二个妊娠期行动起来。如果Target能够赶在所有零售商之前就知道哪位顾客怀孕了,市场营销部门就可以早早地给他们发出量身定制的孕妇优惠广告,早早圈定宝贵的顾客资源。

    可是怀孕是很私密的信息,如何能够准确地判断哪位顾客怀孕了呢?Andrew Pole想到了Target有一个迎婴聚会(baby shower)的登记表。Andrew Pole开始对这些登记表里的顾客的消费数据进行建模分析,不久就发现了许多非常有用的数据模式。比如模型发现,许多孕妇在第二个妊娠期的开始会买许多大包装的无香味护手霜;在怀孕的最初20周大量购买补充钙、镁、锌的善存片之类的保健品。最后Andrew Pole选出了25种典型商品的消费数据构建了“怀孕预测指数”,通过这个指数,Target能够在很小的误差范围内预测到顾客的怀孕情况,因此Target就能早早地把孕妇优惠广告寄发给顾客。

    那么,顾客收到这样的广告会不会吓坏了呢?Target很聪明地避免了这种情况,它把孕妇用品的优惠广告夹杂在其他一大堆与怀孕不相关的商品优惠广告当中,这样顾客就不知道Target知道她怀孕了。百密一疏的是,Target的这种优惠广告间接地令一个蒙在鼓里的父亲意外发现他读高中的女儿怀孕了,此事甚至被《纽约时报》报道了,结果Target大数据的巨大威力轰动了全美。

    根据Andrew Pole的数据模型,Target制订了全新的广告营销方案,结果Target的孕期用品销售呈现了爆炸性的增长。Andrew Pole的大数据分析技术从孕妇这个细分顾客群开始向其他各种细分客户群推广,从Andrew Pole加入Target的2002年到2010年间,Target的销售额从440亿美元增长到了670亿美元。

    如果说“啤酒与尿布”的故事标志着商业智能(BI)时代的到来,那么“塔吉特孕妇”的故事标志着商业智能进入大数据时代。我们能够想象到的是,许多孕妇在浑然不觉的情况下成了Target常年的忠实拥泵,许多孕妇产品专卖店也在浑然不知的情况下破产。在浑然不觉的背景下,大数据正在推动一股强劲的商业革命暗涌,商家们早晚要面对的一个大数据时代的问题就是:究竟是在浑然不觉中崛起,还是在浑然不觉中灭亡。

    这里我们要介绍三位数据大师的故事,正是他们的存在,使我们进入大数据时代。

    [1]Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。