9.1 让自己作好准备

我们只有充分了解了自己掌握的原始材料,才有可能用数据把故事讲好。而这往往是设计数据图表时最容易被忽略的。在开始阶段,的确很容易陷入对最终效果的憧憬和痴迷中。你想要一张看起来精彩、漂亮又有趣的图表,这没什么问题,但如果还不知道要可视化什么东西,谈这些无疑是痴人说梦。最后你可能只能得到类似图9-1这样的东西。你连数据集中有什么数据都不清楚,又怎样去突出那些亮点呢?

9.1 让自己作好准备 - 图1

图9-1 大型图表蓝图。大而空洞

要研究数字和其中的度量标准。找出它们来自哪里,又是如何被估算的,还要检查它们是否合乎常理。正是这些早期的数据收集过程让《纽约时报》的图表变得如此优秀。我们看到的只是报纸或者网站上的最终结果,却不会感受到在动笔绘制之前所需要付出的大量努力。很多时候,仅仅只是将所有数据排好序所花的时间就要远远超过绘制图表的时间。

所以,当下次拿到一个数据集的时候,请试着不要立刻就埋头开始设计。那是懒人的办法,而且会在最后暴露出所有的缺陷。最好还是花点时间了解你的数据,研究这些数字的上下文背景。

提示 可视化的目的就是传播数据,所以要花时间了解什么才是你的图表的基础,否则你最终只是在堆砌数字而已。

把数字丢到R里面检验,阅读附带的说明资料,以确保你了解每一种度量指标所代表的意义,并且检查是否有看上去奇怪的地方。如果有,而你又不知道背后的原因,那么就去联系数据的提供者。人们通常会很高兴有人用到了他们发布的数据,也会很希望能找出其中的错误并加以修改。

在充分了解了数据之后,就可以开始设计图形了。我们可以打个比方。还记得电影《龙威小子》(1)中丹尼尔刚开始学习武术的那一段吗?宫城先生让他给一堆汽车打蜡、给地板抛光、整修花园的栅栏,这让丹尼尔非常沮丧,因为他觉得做这些事情毫无意义。理所当然,最后各种阻挡和出拳的技巧一下子全都自然地涌现、达到了心神合一,因为他其实一直都在练习正确的功夫动作。对于数据来说道理也是一样的。尽量多了解数据,最后用视觉手段来讲故事自然就会水到渠成。如果你还没看过这部佳作,赶紧承认吧,然后把《龙威小子》加到你的Netflix(2)列表里面去。