随着互联网的发展,技术一直在改变着教育。大约有二百万学生在K-12虚拟学校注册,全部或部分采用在线上课的方式。努力为学生在学校配备便携式电脑、上网本或平板电脑的1:1计算倡议,其声势日益加强,预计将在教育系统中普及使用电子设备。而且,学生、家长、教师和学校领导都在使用社交媒体进行交流。学校、行政区、州教育局以及美国教育部也采用社交媒体与利益关系人和数字公众进行沟通。在教育数字化过程中,我们的在线活动会产生巨大的数据宝藏。数据的量已经大到超出单个计算机的计算和处理能力,因此经常需要一组计算机用于数据处理。数据产生的速度也是非常之快,过去两年的时间产生的数据占有史以来数据总量的90%。数据的种类非常广泛,数据来源多种多样,有电子设备的使用日志、web浏览数据、社交媒体数据、地理定位图像、音频数据等。这种大数量、高速度和多样性被认为是大数据的固有特点。另外,可穿戴设备和人脸识别预计将为日益增长的数字化教育系统带来更多实时数据。虽然在教育中应用大数据技术尚处于萌芽阶段,但是从大数据中抽取的信息价值将为个性化学习和教育政策制定提供独具特色且极具希望的机遇。当然,大数据的蓬勃发展也伴随着一系列问题:数据安全、隐私保护以及使用个人数字数据的道德界限。本文即是以此展开对大数据用于教育的讨论,呼吁教育工作者、政策制定者、研究人员增进对大数据的理解,以便更好地在当今这个数字时代为学生服务。
大数据改变教育的潜力非常大。我们现在所教的学生是伴随着互联网长大的。他们大量的学习和日常活动可以被数字追踪,这些活动包括但不限于计算机上的鼠标点击和键盘输入、智能手机与平板电脑上的标签和滑动、移动传感器检测到的移动、以及无所不在的数字相机记录的面部表情。虽然大数据的发展才刚刚开始,但是其在教育领域的应用前景早已显现。我们主要讨论两个领域中的应用:学习分析和教育政策。
随着大数据的涌入,学习分析成为一个迅速发展的领域,包括评测、收集、分析和公布有关学习者及其背景的数据,旨在改善学生的表现,同时评估课程、计划和机构。利用各种领域(如信息科学、计算机科学、网络科学、学习科学、数据挖掘、统计学、社会学和心理学)中的概念和分析技术,学习分析不仅应用于传统的面对面学习环境,而且应用于基于计算机的教育,如学习管理系统、自适应超媒体教育系统、计算机支持的协作学习、智能教学系统等。除了分析学生的人口统计特征、考试成绩、心理调查问卷,学习分析充分利用从鼠标点击获得的各种细粒度信息、努力的次数、学习浏览模式、网络聊天、论坛参与、视觉和面部反应。所有这些数据对于教育和研究人员都是重要的指标,可以在前所未有的规模上开发学生的学习活动和社会交往。另外,移动设备激增以及《带上自己的设备》倡议(即,学生将自己的移动设备带到学校用于学习)使学习环境的界限变得模糊,促使研究教学法的团体不断发展壮大,促进移动学习的应用,远远超出了教室学习和计算机屏幕的范畴。有些学校早已开设了移动学习课程。学生用智能手机和平板电脑进行语言学习和科学探究。尽管人工智能、教育数据挖掘和知识管理方面的团体正在壮大,大量的非结构化和不一致数据也带来了前所未有的技术和分析挑战,如同在一个可升级的方法中,我们试图将大数据转换成改善学生学习的方法一下。因此,必须重视可升级性,以充分利用络绎不绝的学生实时学习数据流,如此也可丰富我们对学生学习过程的理解,酝酿新的学习评估和教育学典范。
除了利用学习分析了解学生的学习,大数据还有可能预测教育政策制定和政策实施。互联网用户(特别是社交媒体用户和博客主)除了定期参与民意调查,互联网用户,特别是社交媒体用户和博客主经常在线交换其意见和观点。作为一种新的公众意见来源,这些在线评论和信息于政策制定者而言意义重大,它们有助于理解问题和公众需求、制定政策以解决相应问题、评估政策的有效性,甚至可以让公众参与进来一起形成意见并解决问题。公众意见的在线数据源通常可以提供丰富的行为和背景因素细节,包括文字信息(如某一给定政策的文字信息)、时间信息(如信息发布的时间)、结构信息(如谁和谁讨论过政策事宜)。到目前为止,社交媒体早已用于判断公众对于移民政策和边境安全、太空政策以及国家安全局监管程序所持有的意见了。这些公众政策应用案例意味着教育政策也可能从大数据中获益。例如,推特主题标签#CommonCore、#CCSS(州立核心标准)、#EdPolicy(教育政策)、#EdReform(教育改革)是50个州教育局最常使用的主题标签。由社交媒体用户在热门社交网站上产生的数字化文本数据是衡量教育政策制定(如中小学教育法案再授权)和政策实施(如州立核心标准)公众意见的重要指标。利用应用程序接口(API)和/或网页抓取技术可以实现数据自动采集,以提取某个主题的推文、FaceBook用户发送的评论、互联网用户的网络搜索内容以及博主共享的教育博客,仅举数例以供参考。如果能够在实时无延迟的情况下获得、处理和分析这些数据,政策制定者们就能够及时获悉教育政策的公众意见,评估政策实施,并采用众包的方式将公众纳入到问题解决方案的制定中来。
丰富的技术和丰富的数据系统在引领教育的同时,大数据也为教育利益关系人带来了特有的问题,需要在大数据应用的便捷性、数据安全以及隐私之间不断进行平衡。在教育领域,不断升级的问题是数据安全、隐私保护以及使用个人数字数据的到的界限。
在教育中应用大数据其安全和隐私问题尤甚。首先,随着大数据空前地增长,随着我们对数据数字化的不断努力,各种问题也随之而来,例如,防止数据被滥用和误用的同时如何存储、处理、使用学生学习数据。学生学习数据通常收集和存储到不同的数据仓库中,比如学校行政办公室、在线学习系统以及移动设备中,这些数据源之间彼此并不相连。一方面,数据仓库之间彼此隔离有助于提高数据安全,这主要是因为一个数据库中的数据安全漏洞不会引发整体数据系统的数据泄露。另一方面,这种隔离性也会逐渐降低数据的巨大价值。这就需要在数据共享性和安全性之间进行微妙的平衡,这也为开发允许数据库之间彼此连接进行通信,从而消除数据孤岛的数据安全协议带来技术和法律的挑战。将大数据用于教育的另一个问题是从长远来说,学生学习数据和个人信息的使用可能会对学生不利。通过提供由一套自适应学习算法优化过的学习资料,当大数据可以使学生按照自己的进度学习,学生的学业成绩也会不断被数字追踪。这种追踪可能会引起不好的后果。Mayer-Schönberger 和Cukier (2014)在其著作《大数据学习——教育的未来》中描述了如何使用学生过去的表现数据就会使高等教育将学生拒之门外。将学生困在过去,剥夺他们进步、成长和改变的能力,这样的责任我们可负担不起。因此,迫切需要制定政策和法规以防学生学习数据被滥用和误用,在利用大数据促进学生学习和拒绝认可学生未来发展之间一定要划清界限。
其次,在缺少当事人知情同意的情况下使用个人数字数据用作研究目的也引发了关于道德界限的激烈争论。一个在FaceBook上进行的情绪传染实验近期引发了一场争论。Kramer等人认为在他们的研究中,一些Facebook用户的新闻推送内容是可以被操纵的,“这与Facebook的数据使用政策是一致的,所有的用户都同意在FaceBook上提前建立账户,等同于本项研究的知情同意”。但是,有些人则认为此项研究中所包括的用户可能并不完全知晓这个实验是志愿参与。互联网的发展总是超前于法律和法规。直到现在还缺少能够在大规模的互联网社会实验中保护参与者的机构审查董事会协议或联邦法规。当参与者特别是学生参与到实验中时,如果没有明确请求其知情同意的时候,问题会更严重。因此,在促进科学发现和创新的同时,很有必要解决个人数字数据使用的责任与问责问题。
科技的发展势不可挡,大数据的浪潮似乎不会消退。大数据出现在教育领域使这样一场思维实验显得极为必要:在不太遥远的未来,大数据如何潜在地改变教育。考虑到大数据正在不断发展中,大数据之于教育的很多尚未预见的机遇与问题并没有在此涉及。总体看来,上述讨论的机遇与问题表明,如何使用大数据明确地增加学生学习兴趣,同时,如果大数据在教育中的应用尚未得到检验,则要保持谨慎,对于这些问题,需要经过长期的讨论。教育领域中每天产生的数据汹如潮水,在这种情况下,这样做尤为必要。教育技术必然会发展,大数据分析技术也必然得到不断的创新和改进,我们希望教育实践者、政策制定者和研究人员不断加深对如下有关大数据知识的理解:有助于充分利用大数据在教育中巨大潜力的知识;以某种有意义的、建设性的方式质疑教育大数据思想的知识;谨慎地将大数据应用于教育的知识。