探寻“是什么”而非“为什么”
另一个观念的转变加速了概率预测的发展,而这个转变是必要的:过去我们相信自己发现因果关系的能力,如今必须意识到我们通过大数据看到的往往是相关关系。这些相关关系似乎是不为我们所知的变量之间的连接和关联,它们不会告诉我们事情如何发生,而是向我们说明正在发生的是什么。但是在大多数情况下,这足以帮助我们作出决策。
比方说,冯·安对西班牙语使用者使用分时(以及如何分时)学习代词的方法效果更佳的发现,就是相关关系的产物。同样地,吴恩达排列班级论坛帖子的方式,是建立在学生阅读帖子后成绩提升的程度之上的,这完全是相关关系的体现。他们的实践并未涉及在其间发挥作用的根本原因——因果关系。这是一个“是什么”,而不是“为什么”的问题。
对相关关系意识的确立,是具有挑战性的。我们随时准备着以因果关系的视角看待世界:我们会因为相信自己发现了原因而感到欣慰,这使我们感觉到自己正在理解世界的内部运作。然而,尽管付出了不懈的努力,我们真正发现的因果关系却比想象中少得多。深层的研究显示,通常我们对因果关系的快速直觉是完全错误的。
但这并不意味着对因果关系的探索是个错误(或是干脆放弃寻找原因),事实远非如此。但是我们也许应该变得更加谦虚,而不是自以为能够理解周围的世界。与其付出巨大的代价追究一个难以捉摸的原因,不如通过非因果的分析,把目标首先定位在理解“是什么”,而不是“为什么”之上。
有了大数据,我们可以基于预测改善教与学——那些草原上神秘的单间校舍正在为电子平台所取代——这就是我们接下来将要关注的内容。