正视大数据的黑暗面

    亚利桑那州立大学和美国的许多高校一样,面临着大学新生数学成绩不佳的难题。尽管学校开设了补习课程,仍然有1/3学生的考试成绩低于C,这是导致他们毕业时拿不到学位的重要原因。为了缓解这个令人沮丧的状况,亚利桑那州立大学转而使用著名教育科技公司Knewton的适应性学习软件。其结果是,从2009年到2011年,考试通过率从64%上升到75%,而辍学率减少了一半。

    但是,让我们想象一下这个看似成功的故事的另一面:如果被软件收集的数据永远不会消失,并且学生曾经有必要参加补习课程的信息成了几十年后都可以读取的永久记录,将会带来怎样的后果?假如技术系统所作的预测试图改善学校毕业率的途径不是鼓励学生上进,而是强迫他们离开——为了提高留下的学生的平均成绩——又将带来怎样的后果?

    这类情形极有可能发生。一些教育改革者提倡的“电子书包”(digital backpacks)会让学生身负着他们整个学校教育生涯中的电子成绩单;而适应性学习的算法也可谓是一门令人畏惧的艺术。可汗学院的“数据分析主管”贾斯·科梅尔(Jace Kohlmeier)提出了关于学生学习的“领域学习曲线”[1](domain learning curves)。“为了提升平均准确度并让学习曲线的末端显示更出色,我们可以在早期打击那些能力较弱的学习者,并怂恿他们中途放弃,”他解释道,“但这绝不是应该做的事!”

    至此,本书都在叙述大数据改善学习和教学的非凡途径。但现在,让我们把视线转向大数据的黑暗面,思考由此引发的风险。学生家长、教育专家长期以来对未成年人的隐私保护和对学生的学业追踪带来的后果忧心忡忡,因为这是限制学生未来发展机遇的潜在威胁。大数据不但会放大这些问题,还会改变它们的本质。在这里,和其他地方一样,规模的变化将导致状态的变化。


    [1] 学习曲线,广泛应用于各生产领域,是一种通过生产者行为学习与经验积累而得到改进的产出的特征函数,利用学习曲线可以科学地制订出成本计划、改善作业计划、质量改善计划等。可汗学院将学习曲线这一观点应用于分析学生学习,以期提高学生就读的巩固率。——译者注