7.1 分析与报表
许多组织认为分析与报表是一回事。这种观点看起来好像很对,因此我们需要深入讨论一下。报表很重要并且很有价值,正确使用报表可以显著地提升价值。但是报表有它的局限性,我们必须知道这个局限性是什么。
总体来说,一个组织要想在大数据方面有所成就,报表和分析都不能少。这一结论是显而易见的,正如二者已经在之前的其他数据源上发挥了很大作用一样。关键问题是清楚地理解报表和分析的区别。另外,还需要明白二者的共同之处。如果没有这些深刻的理解,你的企业一定会在这方面吃亏。
思想是分析之父
分析可以生成报表,报表也可以生成分析。大多数情况下是报表生成分析。例如,你可能有十个报表在桌子上,把握它们中的关键信息,总结出你的新发现,并搞清楚这意味着什么,这就是分析。正是人们在数据和统计领域中的思想和思考创造了分析。没有经过翻译和解释的数据和统计是没有用的。
7.1.1 报表
让我们先来给报表下个定义。报表环境常被称为商业智能(BI)环境。正是在这种环境中,使用者选择他们想要运行的报表,执行该报表并查看结果。这样的报表或许会包含表格、图形、图表或它们的结合。以下是定义报表的关键因素。
■ 报表能够将所需的数据反馈给使用者。
■ 数据将以标准的、预定义的格式呈现。
■ 在生成报表的过程中,除了通过报表界面请求报表的使用者外,没有其他人参与(我们假定报表模块已经被创造和部署好了)。
■ 综合以上几点,报表不够灵活。
我们需要澄清最后一点。创建复杂报表模块的同时,可以创建多种提示(prompts)和筛选(filters)。在这种报表内很可能包含有多种选项,但有了那些预定义选项的限制后,报告就变得相当不灵活了。一般的使用者很难生成全新的报表,或者检查那些预定义的提示和筛选是怎样工作的。使用者可能选择仅仅简单地填写那些默认的提示和筛选。
一种误用报表的情况是:手头上有大量可用的报表,但误以为它们是大量可用的分析。这种现象在许多组织中都很常见。管理商业智能环境的IT人员会说,“我们有世界一流的BI环境。我们有500多份可用的报表,它们可以覆盖任何商业领域,任何人的需求。我们的业务人员拥有他们想要的一切。”
同时,业务人员会说,“太失望了!我们花费了一两年时间来创建这个报表系统,但我依然没有得到我需要的。”如果业务人员和IT人员走到一个屋子里,会话往往是这样开始的,商务人员抱怨他们没有得到自己需要的分析结果,IT人员会说,“你们真是疯了!有500份可用报表还不够吗?”最终导致双方相互指责。
分歧源于下面的事实:好像埋藏在500份报表中的东西才是业务人员所需要的。但当报表多达500份时,他们很难从中找出自己想要的。另外,任何两个人都希望用不同的想法看待同一件事情。每一个商务人员都希望在报表上有一个额外的度量标准,或者用一种不同的方式去组织报表。或许会有500份报表摆在那里,但是没有一份是任何商务人员都想要的。
在报表中,数量不重要
许多IT组织致力于建立尽可能多并且尽可能覆盖所有话题的报表。这可能受到业务人员的如下行为驱使:他们提交了覆盖他们所有可能用到的所有可能的需求,而不是他们真正需要并且会使用的需求。结果,业务人员收到各种各样的报表,可还是得不到他们想要的信息。将焦点放到提供紧密关联的有限报表上。不要掉进这个陷阱:认为拥有最多报表的那个人会获得胜利!
与生成500份各种类型的报表相比,提供少量满足终端使用者需求的报表的效果要好很多。重要的是报表的相关性,而不是报表的数量。然而通常情况是,人们更多地关注报表数量而不是相关性。正如我们接下来要讨论的那样,即使拥有了所有商业报表的完美组合,仍然无法提供优质分析,而这些报表仅仅是分析流程中所需的一些数据而已。
有的时候我们不需要对报表进行深入分析。例如,假定你有一个每周产品的销售报表,并且你想知道你的产品是否达到了它们上周的销售目标。通过运行这个报表,答案很快就呈现在了你的面前,也就没有做进一步的工作或分析的必要了。这是增加报表价值的一种方式,它们能够快速简洁地回答常见的问题。如果一切顺利,那么就没有做进一步工作的必要了。如果某些事情看起来与期望不符,那么再做进一步的分析。
7.1.2 分析
定义了报表之后,我们再来定义分析。由此,我们便可比较和对比两者。以下是定义分析的关键点。
■ 分析提供问题的答案。
■ 分析流程要执行许多必要的步骤来获得问题的答案。
■ 因此,分析是为解决特定问题定制的。
■ 分析需要一个指导分析流程的人。
■ 分析流程是灵活的。
分析大概就是说:“我知道了问题,我将整合一切所需的东西去解决这个问题。”这是一个相互作用的过程:一个人处理一个问题,找到获得答案所需的数据,分析那些数据,然后还需要解释分析结果以便为接下来的行动提供建议。以下是分析与报表区别的总结,如表7-1所示。
表7-1 分析和报表的总结
报表与分析之间的相互影响与相互作用很常见,也很有必要。事实上,它们彼此会使对方更加有效。例如,考虑这样一种情形,一个销售经理拿着一份基础销售总结报表,这份报表显示了该地区的月销售情况。这份报表很简单,销售经理查看了每一天的销售情况,然后他将对业务是否在正常运转有个大致判断。直到有一天,他看到一些反常的数据,甚至他自己也搞不懂。于是,他走出大厅去提醒分析团队,告诉他们销售总结报表上有一些奇怪的数据。销售经理要求他们深入挖掘,以搞清楚到底发生了什么。他的这个基于报表的要求产生了一个分析,而这正是分析专家应该做的事情。
另一方面,讨论一下被指定的分析专家将如何解决这个问题。他检查并识别出了问题的深层原因。过了一会儿,他回来了,并向销售经理展示了他的发现。经理或许会说,他刚才整理得到的数据真是太有用了。他生了新的报表并确定了产生经理所述问题的原因,经理想要在以后的基本分析中看到与新报表相似的信息,即使销售数据目前看起来仍处在正轨上。
刚才发生了什么?他对一个问题的分析导致了一个新的报表标准的问世。他将他所做的事情进行了自动化,且这成为了一个新的报表标准。
当你的组织试图驾驭大数据时,一个优质分析可能会是这样的:把你所拥有的数据以一种不同的方式,围绕新的目标进行分解。这是用一种前所未有的视角来查看业务状况。分析专家所做的大量工作可能不会那样令人兴奋,他们通常以分析前的数据准备工作和大量的简单计算作为分析工作的起点。
分析的价值在于使用不同的方式观察数据
分析的关键不是将问题复杂化。有时一个简单的分析就会提供所有的答案。以不同的方式看待数据常常会产生强大的洞察。如果没有必要更花哨,就停止在当前的程度上。另外,要乐于发现新的、简单的解决方案,并快速把注意力转移到下一个问题上。
在一个问题变得清晰前,通常没有必要搞得太花哨。价值在于用不同的方式做事情,而不是做一些花哨的事情。例如,或许在零售连锁企业中出现了反常的销售情况。一种解决方案是建立一个复杂的预测模型,这个模型仅仅旨在决定是什么因素造成了那些反常。然而,第一步首先是查看供应链上是否出现了问题。也许是运输延误或者恶劣的天气导致消费者躲在了家中。如果已经足以确定销售反常的原因,那就没必要建立一个花哨的模型。你通过一个简单的分析就找到了原因,而分析也可以到此为止。
7.2 分析的G.R.E.A.T原则
有价值和影响力的分析才是优质分析。为了使一个分析能够增值,需要把大量的因素进行汇总。优质分析和无效分析的区别是什么呢?优质分析符合G.R.E.A.T原则(指导性、相关性、可解释性、可行性、及时性)。下面让我们简要说明一下这个原则。
7.2.1 导向性(Guided)
一个优质分析会以业务需求为导向。完成分析不仅仅因为它很有趣或充满了乐趣,尤其是针对大数据的分析,分析人员很容易陷入一些有趣却不相关的分析工作中。伟大的分析总是从一个特定的业务问题开始的。一旦开始,分析将会以所需解决的问题为导向。分析的每一个步骤都应该以所需解决的问题为导向。
7.2.2 相关性(Relevant)
显然,一切优质分析都必须同业务相关。这并不意味着随意地选择一个业务问题。所选择的问题应该是这样的:业务人员需要一个解决方案,并且业务人员有能力解决这个问题。如果产品已经停产,那么评估不同群体顾客对该产品价格的敏感程度就变得没有意义了。
7.2.3 可解释性(Explainable)
一个优质分析需要被有效地进行解释,这对基于分析的所要采取的措施来说很有必要。技术细节可能会成为分析是否有效的证据,分析结果必须以决策者可以理解和消化的方式展现出来。一个优质的分析,是可解释的,且容易被决策者接受并使用。
7.2.4 可行性(Actionable)
一个优质分析是可行的。它会指出具体的步骤,企业可以利用这些步骤来改进自身的业务。如果企业绝对不会将一些商店移动到一公里以外,那么我们的分析中就不应该有类似的步骤。如果没有能力去实施这些步骤,那么分析只是无稽之谈。
7.2.5 及时性(Timely)
一个优质分析需要被及时提交,这样才能在需要做决定的时刻发挥作用。如果一个问题需要下周解决,那么下个月才给出答案将无济于事。某个分析方案可能会在各个方面十分完美,但是它无法被及时完成,从而导致无法支持决策。如果是这样的话,选择另一个问题,把精力用到那个问题上面。一个迟到的分析不是优质的分析。