第6章 照片档案的地理之美
Jason Dykes和JoWood
照片可以是美丽的。把能够捕捉精彩瞬间、点燃激情并能激发崇高的东西仅仅看做是数据,这是对照片的一种贬低。然而一旦以数字形式存储,处理相片的二进制数据可以与处理任何其他的数值型数据流一样。但是我们可以对这些照片做进一步处理:收集在一起、排列整理、添加描述标注,由此我们可以创建出一个场景,并且一个新的美好的东西也由此而生。这种美虽源于组成它的所有照片,但却又远远超过了每张照片的所有美丽汇总。
在本章中,我们将探索以地理的视角审视一组照片时,所能发现的美。我们将通过地图和其他图形来对地理特性进行可视化检查。这里的“地理”指的是允许我们把一些东西同某个地方(pace)或位置(lcation)(这是两个截然不同的概念)关联在一起的信息。当我们处理数据时,有很多相关的地理信息。有些人估计大约有80%的数据是地理数据(McEachren和Kraak 2001)。地理信息可能是直接以经纬度坐标的形式进行记录,或者是这个地方的邮政编码、名称或一些其他的信息。这种地理数据将是组织、过滤和解释数据的有用的方式。记录不断增长的、巨大的数据集中的地理信息,可能会为关于某个地方的观点分析提供格外有用的信息资源。
可以通过很多途径把地理信息和数据进行关联。这个途径可能是数据收集过程的组成部分(例如,卫星遥感);也可能产生于查询和解释数据的过程中(例如,以G公司本地搜索为代表的一些地理位置相关的服务);也可能产生于更先进复杂的时空分析过程中,它是“直觉构建”(Snsemaking)过程的一部分,且当前的地理可视化分析正是其典型代表(Adrienko等2008)。在这里,我们采用在收集过程中已经通过特定的定位方式取得了其地理信息的数据作为起始点数据,但这些起始点数据也包含了一些额外的、地点不明晰的描述。地理档案包含了超过100万的带有精确的经纬度的照片。这些照片的经纬度有的是通过带GPS功能的设备如iPhone获得的,有的则是由一些人为的方式在地图上手工定位了他们的照片。此外,这些照片的地理信息也有可能是它们的拥有者以非格式化的文本形式提供描述,或者可能是以邻近地区的名字给照片命名,或者是对照片捕捉到的特征或者活动进行描述。这其中有一定的复杂性和精妙性,而且我们应该明白,当我们试图通过可视化方式来加强对位置和地点描述之间相互作用的知识时,美丽将“油然而生”。
当我们编写优美的代码时,通常情况下都有很具体的目的,比如对列表进行排序,求解线性方程组,或者完成傅里叶变换。代码之美源于达成目的(Klawa 2007)。当处理美丽的数据时,我们的目标往往不是非常明确。分析数据是科学探索的一个重要环节,而且可以带给人们更深的洞察力,并且测试假设情况和验证先前的理论。美丽的数据值得探索。它包含的模式、结构和异常情况虽然不能立即显现出来,但是在进行更深的深度挖掘时,它就显现出来。我们在工作中通过可视化方式探索数据过程中,形成了两个长期的传统。为了进行信息通信以及支持知识发现,制图学已经发展了强大的技术来通过可视化方式表示地理数据。几个世纪以来,它已经成功地将开拓创新、科学活力和更多主观的设计和批判技巧相结合。地图本身可以与它们所描述的对象同样美丽。信息可视化涵盖了数据的可视化探索过程,该过程可能与地理信息毫不相关,而只是通过设计和图形、图表以及相关的交互行为。在本章中,我们将报告一些融合了制图学和信息可视化的基础原理的探索地理数据之美的方法。