什么原因让学生中止在线课程的学习?

    迪亚兹感到很困惑。他无法理解为什么人们在生活的其他方面信奉统计数字,却对它们的学习应用如此抗拒。他说:“我们一方面获取计算数据,并使用计算机模拟数据创造幻想中的足球队,而另一方面,我们却声称难以将定量问责制引入教育领域。”

    从迪亚兹的经历来看,他对此很有发言权。在取得了化学专业的学士学位之后,他在佛罗里达的迪斯尼乐园从事了一年地下水测试工作。此后,他转而研究教育学并取得了教育学专业的硕士学位。接着,他攻读博士学位,重点研究应用统计学和测量学。(在这条求学路程中,他还获得了一个法律学位)。身为一名西弗吉尼亚大学统计学和教育法的教授,他开始思索那些影响学生辍学率的因素。他特别关注在线课程的辍学率,因为这些课程通常是针对工作繁忙的人们特别设计的,目的是使学校教育能更好地融入他们的生活。然而即使如此,还是有许多人没能完成课程,最后与学位失之交臂。

    在美国,有数百万选择在线课程的学生(甚至包括在实体大学就读的学生),吸引他们的是在线课程的便利性和相对低廉的成本。2011年,迪亚兹教授和几位来自其他机构的学者发起了一项联合研究,意在找出引发那些令人烦恼的辍学率的原因。而他们相信:答案就在数据中。获取了来自六所学校的数据和盖茨基金会提供的一百万美元资金支持之后,迪亚兹的团队开始汇编数字档案。

    记录中的学生信息最终增加到了一百万条(均为匿名),可供分析的变量也达到了33个。一些变量是相当基础的,如年龄、性别、年级、正在攻读的学位等;另一些变量就不是那么直观,如学生所选课程的规模、他们的兵役状态等;还有一些更不常见的变量,如学生曾经注册过的课程总数;还有一些信息,只有移至数字化背景之下才可能被监测到,如学生最后一次登录课程后距离现在的天数。总而言之,这些档案总共记录了数百万个数据点,具体细分到特定的课程。

    迪亚兹的团队正在探究最可能揭示学生辍学行为的先期因素。在此过程中,他们有了出人意料的发现。一个能够预示学生继续学业的强有力指标,不是他们的年龄、性别或分数,而仅仅是他们的选课数量。迪亚兹教授说:“就概率而言,那些开始的时候选择较少同期课程的学生更有可能坚持下去。”

    和其他优秀的专家学者一样,迪亚兹教授正着手证明这些研究成果。虽然现在仍处于研究初期,需要投入更多的研究,但是这些研究结果对于公共政策将产生重大的影响。美国财政拨款的资助条件是要求受资助人修读全日制课程,但研究数据显示相关条款可能存在很严重的缺陷(实际上,几乎可以肯定,在大数据出现之前,大多数教育政策都是在缺乏实验数据的情况下制定的)。

    如果迪亚兹教授的研究结论得到证实,那么美国教育政策中对超过学生承载能力的课时量要求,就意味着对金钱甚至生命的浪费。