5.4 小结

比例分布数据和其他数据类型的主要区别在于它们体现的是整体中的各个部分。每一个单独的数值都有其意义,而各部分相加得到的子集或者总和也是如此。我们的可视化成果应该体现出这些方面。

如果数据并不多,那么饼图可能最适合你。当然也可以用面包圈图,不过要稍加小心。如果有多个类别的多个数值,可以考虑堆叠柱形图,而非多个饼图。如果你想探索其中随时间而变化的模式,则可以使用堆叠面积图,或者用传统的时间序列图。有了这些作为基础,你的比例图一定会出类拔萃。

在设计和实施阶段,先自问你希望从数据中得到什么信息,然后以此为起点。依靠静态图表是否能把故事讲述完整?很多时候答案都会是“能”,这很好。但如果你决定要用可交互图表,那么请现在纸上拟定出各种交互行为,比如在单击对象时应该发生什么、不应该发生什么。如果你往界面中强塞太多功能,很快就会变得难以掌控。所以请尽量保持简单。找人来试着体验一下,看看他们是否能理解界面的操作。

最后,在代码阶段,你很可能会遇到下一步不知该怎么办的窘境,对于编程新手来说尤其如此。我自己也总是碰到这种情况。当你卡壳时,互联网是最好的求助之所。找一下是否有合适的说明文档,或者与你手中项目相似的研究案例。不要只关注于语法,要学习其中的逻辑思路,这才是最能帮助你的。很幸运,像Protovis和Flare这些函数库都有很多实例,也提供了优秀的说明文档。

在下一章中,我们将继续深入分析、演绎数据,同时拉上我们的好朋友统计学。在研究数据集与变量之间的关系时,R会继续提供很多帮助。准备好了吗?让我们开始吧。

————————————————————

(1) 盖洛普公司由乔治·盖洛普于1935年创立,是全球知名的民意测验和商业调查咨询公司。乔治·盖洛普(Gallup George Horace,1901—1984)是美国著名的数学家、社会科学家,抽样调查方法的创始人、民意调查的组织者,他几乎是民意调查活动的代名词。

(2) 目前的Adobe Flash Builder 4.5版本的界面已经和作者提供的配图不太一样,部分操作也有了变化。关于操作步骤,翻译过程中已经进行了相应的更改。