数据分析:可汗学院的大脑

    2004年,一个刚从哈佛商学院毕业一年的对冲基金分析师应家人要求,给他12岁的表妹纳迪娅辅导数学。唯一的问题是,纳迪娅家住新奥尔良,而他住在波士顿。因此,他在互联网上为她辅导——从此永远地改变了教育的世界。

    关于可汗和可汗学院的故事几乎是众所周知的。十年间,有来自200多个国家的5000万名学生使用该网站。网站集结了超过5000个视频课程,其内容包罗万象,涵盖了数学、科学和艺术史等多门学科,学生们每天要攻克400多万道习题。

    但是,很少有人知道可汗学院是怎样实现如此巨大规模的。在2004年时,可汗学院还没有任何视频的存在,辅导是在选定的时间实时进行的。因为纳迪娅取得了很大的进步,所以家族成员要求可汗辅导更多的表兄弟,包括阿尔曼、阿里和其他孩子。很快,他带领的孩子人数达到了10人,虽然他很乐意帮助他们,但是却苦于分身乏术。

    于是他写了若干程序来协助教学。这些程序能生成数学习题,并显示孩子们提交的答案是否正确。同时,也收集数据——其中蕴含的宝藏。程序追踪每个学生答对和答错的习题数量,以及他们每天用于作业的时间等等。

    “一开始纯粹是为了方便,我把它当作一个保持监督的有效方法。直到后来,我才想到这个反馈系统的潜在用途,”可汗解释道,“通过对反馈机制的扩展和改善,我开始能够了解学生如何学习,而不是学习什么。”

    因此,在可汗上传第一个使可汗学院闻名于世的视频之前,他便设计了收集有关学生行为的数据,并从中获取信息的机制。如果说那些吸引人的10分钟视频课程是可汗学院的心脏,那么时刻在后台运行的数据分析就是它的大脑。

    可汗说,有了这些信息,他才得以处理那些在过去甚至都无法明确表达的问题:学生花费在他们答对的问题上的时间多,还是花费在答错的问题上的时间多?他们的学习,靠的是勤奋还是灵感(也就是说,是通过不懈的努力找到解题方法,还是依靠瞬间涌现的顿悟)?学生出错是因为没有理解教材内容,还是仅仅因为疲惫?上述以及更多关于人们学习的极为基本的问题,终于可以被提出,并且可能得到解答。