结论

    到目前为止,多数人都意识到几乎每个领域都越来越依赖于数据分析的进步。虽然科学主要是依赖于从很少的观察中构建的理论,未来看起来似乎需要收集和挖掘好几百万个衡量尺度;虽然零售业公司主要依赖于“趋势观察者”提供的洞察力,但是现在很多人相信他们应该销售的东西已经淹没在大量收集的数据中了。

    不是花费更大代价独立构建更大的数据集,我相信未来在于利用别人生成的大量数据,把它和我们自己生成的数据进行结合和混合。不论这些数据是否来自我们自己的企业内部、非营利结构或者公共领域,都可以通过重用和连接数据来节省很多开支。希望本章能够启发你找到更好的方法来实现这些。