发现之美
我们考虑的是大规模分类数据集的空间上有序的空间树形图,该树形图的“数据/地理位置比率”很高,在审美上令人赏心悦目,而且把本章中提供的数字作为描述数据之美的备选。但是,美丽的事物应该是清晰、可用的,而且最终必须是令人满意且优雅。Matsumoto(2007)通过计算机代码环境表达了这种观点,坚信优美的代码必须具备可读性。但是,正如地图使得复杂的地理数据以适合目的的方式获得了可读性,这种方式可以决定很多空间关系,实现如航海、地理比较和模式检测的功能。因此,我们的目标是通过图形的可读性,使得Geograph项目的语言具有地理分析意义。我们能读懂Geograph数据吗?我们认为Geograph项目中的图形以及其他的图形意味着我们在诠释现有的、丰富的、美丽的地理数据集上有了不断深入发展,而且使用通过分析确定的描述和地理位置之间的各种关系获取知识,根据获取的这些知识采取措施。
图 6-9:对于六种选定的场景类型,其出现在地理标题和评论的词汇的空间树形图。位移向量表示非叶子节点的绝对地理位置(共现词),并提供了关于位移的空间聚类和空间趋势的信息来满足树形图的空间填充目标(见彩图19)
这些场景视图中描述的空间关系依赖于宽高比和叶子节点的平均地理位置。我们可能会对比这里所描述的更精确的地理位置感兴趣,而且数据密集的树形图对于为更传统的映射选择候选的刻面和描述符一直都很有用。通过树形图推导出的词汇共现图能够帮助我们确定在术语使用上可量化的空间区别。举个例子,我们发现在南部和西南部地区,山谷和丘陵共现的频率比期望的还高,而在北部地区,顶峰和丘陵一起使用更频繁。而且当使用Geograph项目的数据中其他可选的描述方式时,这些关系在不同程度上一直存在。它们可能会反映在选择需要记录的场景的特定方面有偏好:区域地理特征、语言区别、在特定地方贡献图片的个人偏好,或者以上这些特征的结合。不论怎么理解,我们对树形图的理解,由于其他地方的启发,引起了我们对一些其他地方的地理特征的兴趣。同时需要注意的是这里使用了一些较生硬的词汇来描绘乡村。这些趋势可能并非是有意识的偏见,而可能是和为Geograph项目选择一些令人赏心悦目的景观方面相关——这意味着我们对这些数据的理解使我们更加坚信处理的数据之美。我们打算继续探索和分析这种关于地图和更正规的空间地理术语。用户选定的描述性术语的地理特征的以上及其他方面,有助于描述地方的“本体”特征的发展。
图 6-10:在beach基础区块中出现的对选定元素的描述符在地理标题和评论中出现的术语的空间树形图。位置向量表示图6-9中放大部分的叶子节点的绝对地理位置(见彩图20)
我们的图形和探索是不全面的。我们正在研究由社区参与者贡献的地理信息中存在的系统偏见所造成的影响,并提出策略来减轻这些影响。我们正在制定标识符,用来描述视觉设计空间和交互式应用,通过这些标识符可以做出进一步的探索。我们尚未考虑在Geograph项目中所确定的在地理上不同的关系是否会随着时间推移而依然保持一致。然而,这里所描述的方法帮助我们获取知识,克服当考虑规模、结构、多样性和复杂性时会面临的各种不利条件。但是,除了居住在某个地方的大量的志愿者共同努力外,谁还能更好地帮助我们了解这个地方?此外,除了通过精心设计的多元图形来揭示结构和帮助发现,如何能更好地探索在描述范围之内的某个地方的意义?