我是来和大家对话的,而且是一场从未有过如此多倾听者的交流和对话。我想谈谈“如何从大数据中学习、如何用大数据来学习”。
世界上大多数学校对孩子的教育方式并没有改变
我出生在奥地利一个偏僻的乡村,那是一个风景优美的地方。可惜它很偏僻,距离最近的城市也非常远。因此,当我还是小孩时,我父亲就决定:让我接触更广阔的知识。
当时根本没有因特网,即使要得到CD光盘也非常不容易,更没有像亚马逊这样的书店。所以,我父亲决定给我购买一套在他看来“涵盖整个世界知识体系”的百科全书。当时的一套百科全书有二十四大本,价格和一辆小汽车不相上下。我们全家节衣缩食了好几年,才买得起这套书,才让我学到了丰富的知识。
尽管故事发生在很久以前,但这是一个重要的、与“获取”有关的故事。
我的故事也反映了我们经常听到的、从互联网和数字化问世以来一直发生着的变化。互联网和数字化使我们过去十多年获取的数据越来越多。但我们想想,没有变化的是什么呢?或者说,在全球大多数学校里,有什么还没有发生改变呢?
那就是 —— 世界上大多数学校对孩子的教育方式并没有改变。他们仍旧像汽车制造厂的流水线一样在运作教育:学生来到学校,接受模式化教育,然后被踢出学校。这太疯狂、太荒谬了。
当今世界能拥抱丰富的差异和多元的色彩,想到这些已经实现的可能,我们就要问:在这个世界上,为什么我们的孩子还在相同的方式下,接受批量的教育与学习呢?
大数据能帮我们更好地进行测量
有人会说:因为钱或者资源的缘故,我们无法给每个孩子提供独特的教育内容。但我认为这是个错误的答案。孩子们是我们的未来。我们现在为孩子们投入时间、资源,将来就会有十倍、百倍的产出。因为,只有当每个儿童都发挥出他们的个人潜力,我们才能应对未来将会面临的挑战。
为达到这个目的,我们不能重蹈从前大规模生产的覆辙。当然,我们也不可能给每个孩子配一个教师,但是我们仍然可以有所作为。因为我们现在有了大数据技术,能够实现这种改变。
有人可能会说:“得了吧,舍恩伯格。人类一直在使用数据呀,现在又有什么不同呢?”是的,从人类诞生之初,我们就在收集数据。我们观察世界,而观察就意味着收集数据,而且我们在不断使数据变得富有意义。
为什么我们会给每个学生个体相同的学习内容?因为我们缺乏足够的数据,无法实现对教育个体化的支撑。我们因此而被迫困顿于小数据的深渊之中。我个人对此深信不疑:因为缺乏收集足够数据的能力,我们只好对学习的输出进行测量。
以往,我们出版小说或者编制教科书后,并不知道上百万的学生是如何具体使用的。我们不知道他们最喜欢教科书中的哪篇文章、哪个段落、哪句隽语。
然而现在我们可以做到。
设想一下这个场景:成千上万名学生使用平板电脑阅读某本书籍,而我们通过平板电脑内置的软件,能够在全国范围内获取数据,知道哪些章节所有学生都会阅读,哪些章节因枯燥乏味学生连碰都不碰,知道学生在哪一页上停留的时间最长 —— 如果得到这类数据,那么就有利于我们设计出更好的教学内容、编写出质量更佳的教科书。
有了这些数据,我们就能在教室里讨论:为什么第七章如此乏味?
当我们能够捕捉到所有数据时,我们就能利用数据来提出正确的问题,而不仅仅是用数据来回答问题。而且,大数据能够让我们直接得到问题的正确答案。
大数据为每个学生提供了改进学习过程的有力工具
这里,我谈谈Duolingo(多邻国)软件。这个软件主要功能是帮助我们学习外语。全球每天有数以千万计的人在使用多邻国学习外语,他们还利用这款软件做作业,收听别人的讲话或者同别人对话。
他们使用多邻国软件时的所有互动、产生的所有信息和数据,都会被多邻国捕捉并自动存储。深入分析数据之后,他们发现了一些引人注目的现象。比如,西班牙语使用者学习英语时,某些错误犯得特别普遍。而如果对学习顺序进行调整,成功率就会提高很多。可惜,之前从未有人注意到这个问题。
多邻国为什么能成功?因为它靠的是获取到的数据,而并不是靠专家或像我这样的牛津大学的教授。我们缺少数据,没有良好的数据,我们对于如何改进学习往往一筹莫展。
再以纽约市立中学系统开展的数学课程试验项目为例,该项目始于二〇〇九年并持续至今。每位学生的学术表现被自动记录,学生每天做了哪些数学题、做题结果会被自动转换为数据加以存储。这不就是我们苦苦期盼的、恰到好处的、能提供给每位同学的个性化的学习过程指导吗?
采用这样的数据收集系统,每个学生都能充分挖掘自己最大的潜力。大数据为每个学生提供了改进学习过程的有力工具。
大数据不应该导致数据独裁
我对成功有自己的一点看法。哈佛之所以成功,是因为学校给学生提供了最佳的学习环境、学校精心设计的课程让每个人的潜力得到了最好的发挥吗?不,情况并非如此。
那哈佛成功的秘诀究竟在哪里?哈佛花了很多钱来录取最优秀的学生。他们也尝试过以低成本来录取学生,甚至采用大数据来选择学生。但我认为,这是典型的误用,会耽误学生的未来。
学习和教育必然与大数据同行,但我们面临非常危险的诱惑。我们可能会基于数据得出的预测,来筛选、过滤并决定哪些学生进入到哪所学校,哪些学生去从事某种职业。
如果完全基于数据预测,也许还会出现这样的情景:有些数学很好的学生却当不了科学家,有些喜欢演唱的学生仅仅因为语言能力欠佳,无法面对学习的挑战,结果无法学好一门外语。这就是大数据给我们带来的困惑。
数据不应该导致数据独裁。现在有一种倾向,判断学生的未来完全依赖数据的预测,而且对教师的判断往往也是通过数据上的表现开展。比如某位教师采用一种教学模式后,学生的学习成绩出现波动或者下降,我们就说他不适合这种教学模式。这就是数据独裁。
数据运用的核心在于用数据优化学习的过程
我坚信,数据运用的核心在于用数据优化学习的过程。学生、家长、学校、校董等各个利益相关方,都要在学习环境中得到良好的数据反馈,大家才能共同得到提高,从而使学习本身变得更好。
我并不认为,利用大数据来优化学习过程,西方国家就一定处于最优势的位置。我们自认为优秀,是因为我们已深陷于现有的、已经陈旧的规模化生产机制。要摆脱以往的模式带给我们的桎梏,我们仍旧困难重重。但有一个国家能够作出这种改变,这就是中国。
在未来十年,在这场正在发生的学习革命中,谁是真正的英雄呢?我认为不是现在备受推崇的大公司的创始人。
未来真正的英雄,是在座的诸位:各位老师,各位同学,各位身居要职的教育工作者。你们在塑造着我们的未来。只要我们为每位孩子提供独特的教育,满足他们发挥巨大潜力的需要,只要运用大数据的力量来相互帮助,就一定能铸造我们的未来!