引言

    房地产市场在过去几年得到了媒体的极大关注。大约从2000~2006年,随着价格的飙升,我们既惊奇又焦虑地看着房地产行业。从那时开始,随着信用成为稀缺以及丧失抵押品赎回权的蔓延,房地产业也跌入了冬天。在本章中,我们通过分析从2003~2008年旧金山海湾地区50万的住宅销售来近距离探讨这个“故事”。从一个地区的价格在一个很大价格范围内上升和下降的方式,我们可以学到些什么呢?

    我们将从描述数据、如何获取数据以及如何通过重构、转化、清除和增强提升原始数据开始,从而为数据分析做准备。随着分析逐渐深入,我们的大多数发现都会通过图像形式展示。在此过程中,还会介绍一下我们使用的一些工具,这些工具多数都是可以免费获取的。我们的主要工具是R,它提供了统计编程和数据分析环境,在数据分析的各个阶段中都用到了这个工具:获取、清除、分析、诊断和表示。