2017年3月20-21日,由华东师范大学-北德克萨斯大学教育技术联合实验室主办的“教育大数据应用技术”国际学术研讨会在华东师范大学召开。AECT前主席、《教育技术研究与发展》(Education Technology Research & Development)期刊主编Michael Spector教授,北德克萨斯大学讲座教授Cathleen Norris、Gerald Knezek,密歇根大学教授Elliot Soloway,密苏里大学教授Joi Moore,华东师范大学副校长、计算机科学与软件工程学院周傲英教授,教育信息技术学系顾小清教授、陈向东教授、吴永和研究员,复旦大学管理学院戴伟辉教授,北京师范大学教育技术学院武法提教授,国防科技大学朱华勇教授,国家数字化学习工程技术研究中心常务副主任、华中师范大学刘三女牙教授,上海市电化教育馆张治馆长,上海大数据联盟常务副秘书长马慧民等20多位专家出席研讨会并做学术报告,300多位教育领域及企业代表参加了此次研讨会。与会专家学者就教育大数据的发展现状、应用案例、未来趋势等内容作了精彩汇报,为大会带来许多理念、技术和应用之间的启示、互动和交流。
一、教育大数据的深度认知和解读
1.互联网与大数据的本质及其对教育的启示
在谈到教育大数据的源起时,周傲英教授认为大数据的本质是指数据的汇聚和关联,而互联网为数据的汇聚、变现和研究提供了平台和可能。互联网的本质是实现人与人之间的连接(虚拟社交方式)和提高用户体验(线上的学习、工作和生活)。伴随互联网的飞速发展而出现的互联网经济,归纳起来有三大特征,即粉丝经济、智慧经济和分享经济,这在教育领域也可以找到对应的案例,例如专业领域的大咖通过网络聚焦话题和人气、基于在线学习数据的自适应学习和智慧教育方兴未艾、慕课和创客的发展如火如荼。目前互联网+教育的概念也引发热议,其真正的意义在于促进教育的转型升级,包括教学模式、教学过程和评价方式的转变,以及由此催生新的教育技术和互联网教育产业,并为跨界的、颠覆性的教育创新提供可能。
周傲英教授还指出当今时代个人发展的重要差距,不是“数字鸿沟”,而是“热情鸿沟”(Motivational Divide)。如何实现“因材施教”、“寓教于乐”、“教学相长”,这些传统教育由来已久的命题,在互联网经济时代和大数据时代,仍是教育研究者应当思考和回应的关键议题。一方面教育应顺应生产和生活方式的变化,如教材、课堂教学、作业等都应该考虑互联网带来的有利条件,使得寓教于乐变为现实;另一方面教育应充分利用信息技术提升教学效率和质量,摆脱应试教育的噩梦,培养学生的学习兴趣,提高创新能力,弥合学生的“热情鸿沟”。
2.大数据带给教育的机遇和挑战
针对大数据给教育行业带来的机遇和挑战,许多中外学者都发表了各自的见解。刘三女牙教授认为大数据为教育带来三方面的机遇:首先是创新的思维方式,教育大数据不仅在微观层面为个体提供了精准的个性化教学支持,也在宏观层面为教育决策提供了科学依据;其次,教育大数据有利于推动教学管理、教学方式和教学评价的创新实践;最后,教育大数据能够帮助重构教育生态,包括创新人才培养模式,重塑教育理论体系。张治馆长认为大数据能够为现代化的教育治理包括资源配置、宏观调控、科学决策、效率评估、遴选评价等提供支撑;改善学校服务,使学校的课程服务和评价走向科学化,可根据学生的发展规律设计教学内容和流程;助力学生的个性成长,根据学生不同的学习路径提供定制的学习内容和差异化指导;此外还能够帮助企业发现学习规律和改进教育产品。
刘三女牙教授同时也指出,教育大数据的应用面临6个方面的挑战:一是教育数据的复杂性使得教育大数据的定义、内涵和边界尚不明确。二是教育情境的多样化使得建构数据化认知、提供个性化学习服务和构筑新的学习方式,实现从量化自我走向量化学习任重道远(刘三女牙等,2016)。三是教育大数据带来的伦理道德问题日益凸显,如数据主体的权利、数据的价值和教育效用等问题,需要通过培养教育利益相关者的数据素养、解决技术异化的实际问题和制定教育数据应用的相关法律法规来不断加以完善。四是教育大数据的科学研究方法远未成熟,对于教育领域复杂异构的数据,采用何种数据分析方法进行处理,需要依靠理论创新和实证研究的螺旋式发展。五是教育大数据服务运营模式的缺失,包括教育数据的采集表征、存储管理、传输交换、分析应用整个服务链的构建。六是教育大数据应用在标准、技术、产品和人才四个层面都存在需要突破的瓶颈。北德克萨斯大学MichaelSpector教授也提到大数据和学习分析技术在对教育产生显著影响之前面临四个方面的挑战:一是可信度,即分析哪些数据、采用哪些方法分析合适;二是隐私性,即如何在保证不侵犯个人数据隐私的同时合理利用数据分析的结果;三是定制化,即如何确定数据分析结论适用的具体情境和问题;四是解释力,即能否对不同来源数据分析的结论差异做出合理的解释。
3.教育大数据的理解视域
与刘三女牙教授、张治馆长、Spector教授从宏观层面探讨教育大数据的机遇和挑战不同,朱华勇教授从校本大数据的角度分析了个性化学习的需求和挑战以及校本数据的优势和困境。他注意到2016新媒体联盟地平线报告基础教育版明确提出,教育改革的远景目标是反思学校的运行机制以及如何重新设计学习空间,推动个性化学习,而当前中国教育面临的主要挑战包括新高考评价体系、人文素质培养和职业终身教育。虽然国内外教育发展趋势的关注点有所不同,但背后都指向个性化学习的需求和挑战,例如如何从评价知识到评价能力,如何从指出知识的差距到指明学习的途径,如何兼顾社会人格培养和个体关注等。作为应对个性化学习需求和挑战的有效途径,朱教授认为中国的学校和学生具有规模优势,学校信息化水平的不断提高,使得校本大数据的形成具有得天独厚的优势。为解决当前学校大数据发展中面临的自动化数据采集和分析处理水平低,缺乏有效策略和技术应对,容易形成“信息迷雾”的困境,朱教授明确指出教育大数据驱动是一个学校教育教学积累从量变到质变的过程,不是工具而是数据积累的问题,需要兼顾教育领域的大数据和小数据的作用,即大数据寻找共性规律,小数据服务学生个性成长。
顾小清教授从学习科学的角度指出教育大数据可视为一种理解学习的新一代研究工具。她提出三个值得深思的问题:第一,我们究竟想要了解学习的哪些方面以及通过哪些途径了解?第二,我们拥有哪些研究工具帮助我们理解学习?第三,大数据是否是一种让我们更好地理解学习的新一代研究工具?针对前两个问题,顾小清教授认为学习科学研究至少关注了三个层面:首先是通过测试了解学习的成果,例如属于高风险测试的高考和美国教育发展国家测试(NEAP)等,以及属于低风险测试的PISA、TIMMS、PIRLS和NAP等。通过测试可以衡量学业成就,找到学习中存在的问题,为优化教学提供证据,进而创设更有效的学习环境和教学模式等。其次是通过课堂观察、录像、录音等方式,收集学习行为、学习情绪、学习交流、社交参与、认知参与等质性数据进行编码分析,了解学习发生的机制。同样,学习行为数据的抽取和分析可以识别学习的问题,改进教学,丰富学习科学的理论知识。最后是通过问卷、访谈等方式了解影响学习的相关因素,这些主观的自我汇报的数据不仅能够发现学习问题和改进教学,还能够帮助我们理解动机、参与、身份认同等因素在学习中扮演的角色。针对第三个问题,顾小清教授借用自然科学研究中常用的工具——显微镜和望远镜来隐喻大数据在学习科学研究中的作用。大数据在宏观层面可以提供教育决策支持,在中观层面可以监控、管理和优化教学过程,在微观层面可以提供个性化的学习诊断和干预。
二、教育大数据的应用案例
1.新技术支持的教育大数据应用
Cathleen Norris教授和Elliot Soloway教授分享了他们在新加坡一所中学开展的移动学习案例,展示了学生利用各种不同的手机App完成主题为植物生命周期的小组探究学习活动,通过采集学习数据发现,不同组员的贡献率和所参与的活动类型之间存在一致性或差异性,这需要教师结合学生的学习汇报反馈给予合理的解释。通过这一鲜活的课堂个案,两位教授指出有三股力量正在对当今教育产生推动作用:一是信息通信技术的发展使得从人手一台电脑到一人多个设备的时代来临,技术工具越发成为泛在学习中促进个体心智向不同方向延伸的手段;二是教学范式的转变,即从以教师为中心的教学向以学生为中心的学习转变;三是技术丰富环境下以学生为中心的学习行为分析成为可能。但是两位教授同时强调,学习分析技术只有结合围绕制作学习制品的学习活动、学生的学习反思以及教师的教学反思,才能帮助我们真正理解教与学的本质。
武法提教授展示的高中物理“摩擦力”的翻转课堂教学案例则是明显的带有本土化特征的技术变革教育的缩影。武教授指出翻转课堂实施的关键在于教师对翻转情况的精准把握,而技术支撑的翻转课堂的关键在于获取学生数据,便于教师及时掌握学情。通过“云平台+多终端”构建的智慧学习环境为翻转课堂学习过程的数据化提供了可能。无论是课前导学单驱动的自主学习、互动交流,还是课中学习分析驱动的按需教学、问题驱动的合作探究、及时评测驱动的知识内化,无不体现出数据支撑下的学习分析所具有的精准、个性、思维、创造等智慧教育特征。
针对教育大数据的校本应用,朱华勇教授例举了云教学系统在促进个体学习迁移中的作用。在云教学系统中,通过跨接纸质和数字学习场景的工具,能够打破跨介质学习场景的壁垒,实现智能数据的采集和处理;通过基于云应用的选课排课,能够实现分层走班、个性选课的教学管理;通过学生参与设计、教师跨域合作,能够建立个人、校本、区域三级云资源库,为互动翻转课堂的高效生成提供支撑。而基于云教学系统的校本数据则可以从个体学习迁移的分类角度开展不同主题的分析研究,建立大量典型的个体学习模型,从而实现以大数据构建主要学习特征、以小数据开展分析应用服务的目的。
2.多模态数据的分析技术及应用
吴永和研究员介绍了他们团队在多模态学习分析领域开展的一系列研究。第一个案例是传统教辅资源利用微信公众号、二维码、教学微视频和学习分析技术构建新型教育出版与学习服务高度融合、相互促进的生态系统,实现用户学习行为分析、内容个性化推送,进而形成“精品”出版内容和“精准”教育服务深度结合的移动学习新模式。通过数据分析不仅可以发现目标学生群体对教辅材料的使用模式,例如通过了解学生观看视频讲解的时间段,掌握向学生推送信息的最佳时机;以及发现不同学科教学视频播放次数和图书销售量之间的关联,因地制宜地制定销售策略和优化教学资源配置。第二个例子来自“国培计划”中针对中小学教师在线讨论数据的分析评价。对于这类教育领域非常普遍的、质性的非结构化数据,如何基于理论支持的多维度评价模型构建用于特征提取的语料库,采用监督学习的方法训练在线讨论的语义分类器,实现文本数据的自动化/半自动化分析评价,是当前教育数据挖掘研究的难点。毋庸置疑,跨学科的技术工具和研究方法能够更大程度地发挥教育数据的优势。正如顾小清教授指出的,我们不仅需要创新技术工具以采集并获取传统方式无法获得的多维学习数据,同时需要创新分析方法以加深对学习本质的理解,进而推动学习理论的创新。
在教育领域,非认知因素诸如学习情绪、动机、态度等在学生成长发展和学业表现中的作用,已经受到学术界越来越多的重视。许多学者(O'Regan,2003;Phelps,2006;Artinoet al.,2010;D'Melloetal.,2012)指出学习过程是在认知活动和情感状态的相互作用下发生的,有效管理和干预学习情绪、动机等非认知因素有助于提升学生的学习表现。但是当前教育数据的获取和分析仍以认知和社交维度为主,而对于情绪等非认知因素的探知手段有限,通常采用主观问卷调查的方式,有效性较差,且难以实时动态地感知情绪和动机等的变化,更遑论基于情绪感知的情感教学干预。戴伟辉教授展示了一系列关于脑神经科学与传统行为学研究方法相融合的情感计算研究在教育和其他社会科学领域的应用,例如知识建构等认知活动以及情感教学的脑神经机制研究,课堂场景的观测数据(肢体行为、声音的情感特征),网络行为的心理计算,物理和虚拟环境的融合分析,人-机共融环境下的情感识别和计算等。
3.大数据驱动的教育研究范式转移
GeraldKnezek教授通过两个案例展示了大数据技术在教育研究中的不同作用。第一个案例是一个称为“simSchool”的在线仿真学校,与用模拟飞行器训练飞行员的设计能力相类似,该仿真学校用于对缺乏教学经验的新教师进行教学技能培训。新教师可以在理解学生不同学习风格和动态观察学生变化的学习过程和学业表现的基础上,尝试采用不同的课堂管理、教学设计、学习指导策略,以获得学生表现的反馈信息,从而不断改进教学,提高自身的教学技能。实现这样的在线培训系统需要建模动态复杂的教学活动和学生计算模型,例如学生画像考虑了性格的5个维度,包括开放的学习态度、责任心、内向/外向、易相处、情绪特质;现时考虑了认知风格的三个维度,包括视觉型、听觉型和动作技能型;以及学业水平。Knezek教授团队采用面对面指导和仿真实践相结合的方式开展教学技能培训,受训的在职和职前教师人数超过一万人,分析比较培训前后的教师变化发现,除了在教学技能上有明显提高,更有意义的发现是教师在受训之前的教学技能自我效能普遍高于实际教学技能水平,这表明教师对于自身水平的认识不足,过分乐观;而经过充分的仿真教学实践体验,教师的教学自我效能更趋近于他们实际的教学技能水平,说明教师能将教育理论和教学实践更加融会贯通,从而对自身的教学水平有更加客观的评价(Knezeketal.,2015)。
Knezek教授介绍的第二个案例来自STEM教育(即科学、技术、工程、数学),旨在通过引导中小学生调查家庭的能源浪费情况(例如电器在未使用的情况下仍然接通电源造成电表持续走电),以培养学生对STEM学科的未来择业兴趣。在这样一个兼具社会价值和教育意义的课外科学教育项目中,Knezek教授团队并未满足于运用常用的横断研究方法(Cross-Sectional Study)了解短期内学生的科学探究实践对其STEM兴趣培养的影响,而是关注影响的长期持续性,因此在探究活动结束后两年再次对被试进行跟踪调查,以期了解学生对于STEM的择业兴趣是否发生变化。鉴于教育问题的解决通常并非在短时间内可以产生效果,或者我们更关注教学干预的长期效果,因此Knezek教授指出教育评价研究需要实现“范式转移”,即从传统实验研究采用的前后测比较,转向跟踪研究(Longitudinal Study)所感兴趣的潜在变量的变化抑或持续性。为了探究STEM择业兴趣的关键影响因素,Knezek团队采用数据挖掘的方法比较了不同时间阶段(即科学探究活动前、完成活动一年后、完成活动两年后)这些关键因素对于择业兴趣影响的回归模型,以探究模型的稳定性,从而揭示这样的科学探究活动对于培养学生对STEM学科的未来择业兴趣究竟能否产生长期影响(Christensen et al.,2013)。
4.教育大数据的跨学科研究
跨学科研究有利于从不同学科视角为教育问题解决提供多元的解决方案,是教育研究走向深化的必经途径和必然趋势。此次论坛中还有几位专家学者分别从图书馆情报学、教育信息化建设和教学设计等不同角度分享了他们对教育大数据应用的具体思路。例如北德克萨斯大学杜云飞博士介绍了高校数据典藏对于教育大数据分析的意义和在把握科研动向、提炼学科问题中的作用。他分别例举了利用学校的学位论文数据和学生的入学信息所做的关联分析,为提高生源质量和招生策略提供依据,以及利用院系的期刊会议论文发表、基金申请、学术获奖和论文引用情况等科研管理数据所作的学术质量评价研究。科大讯飞的王亚飞工程师从区域教育大数据平台建设的角度分析比较了多种不同的建设思路。他将教育信息化系统比作“小溪”,指出“挖大河”建设面向大数据和众多应用场景的大数据系统或者“织河网”实现不同信息化系统之间的数据互通并不可行,而应该采用“聚水为泊”的方式从不同的信息系统中汇聚教育大数据。他还提出建设区域教育大数据的工作模式可分为三步走:第一步是技术专家发现数据规律,找到相关关系;第二步是教育专家寻求理论支撑,探索因果关系;第三步是行业专家决定是否采用专题模型研究成果。Joi Moore教授则围绕以人为中心的设计(Hu-man-CenteredDesign)和教学适用性(Pedagogical Usability)两方面展开探讨。她认为教学设计应该借鉴设计学的前沿理论和方法,以学生在真实课堂的学习需求为核心,通过分析学习的实际过程和学生的行为表现来评估设计的有效性,发现前期教学设计存在的问题和影响学习效果的关键设计要素,从而优化教学设计。
三、教育大数据的应用趋势展望
华东师范大学陈向东教授援引图灵奖得主JimGray的观点,认为科学研究可分为四个范式,即实验范式、(理论)模型范式、(计算)仿真范式以及数据密集型范式。具有海量(Volume)、多样(Variety)、价值(Value)、高速(Velocity)特征的大数据,将成为科学研究的第四范式(Hey et al.,2009)。这一研究范式将与传统的科学研究(包括传统的教育科学研究)有很大不同。以往的数据只是经验研究和理论研究的配角和检验者,强调先有设计再通过数据验证模型的合理性,而在基于大数据的科学研究中,大数据模型是数据驱动,强调的是建模过程以及模型的可更新性,模型承担了一部分理论的角色。未来这种数据驱动的经验模型将带来一种新的研究范式。当然,对于这一观点,无论是哲学界还是具体学科领域,都存在较大的争议。
伴随物联网、移动通讯与云计算的发展,以及物理空间、网络空间和心理空间复杂关联的多维耦合演化,现代教育的信息感知环境与教学方式正在发生深刻变化。要理解日益复杂的教育环境和学习过程,戴伟辉教授认同需要突破传统的学科研究范式的观点,并进一步指出教育神经学的出现将为知识的个性化建构及其运用、学习与创新提供教育理论与技术方法的支撑;将有利于机理模型、数据模型、实证方法相融合,为现代教育学研究特别是学习科学研究提供新的研究范式;将为教育大数据的精准分析提供行为机理和先验知识、类脑与仿脑的智能分析方法,从而大大降低计算冗余度,提高计算效率。因此加强同其他学科之间的联系与合作是拓展教育数据来源、丰富研究方法、提炼新的研究问题以及实现理论创新的重要途径。
吴永和研究员从数据来源的视角对戴伟辉教授所展示的教育神经学的潜力作了另一番解读。他指出多模态学习分析(Multimodal Learning Analytics)目前已成为学习分析领域的研究热点之一。多模态学习分析意味着按照人的多重感知模式分析测量生物数据,以同步处理被试者不同模态的数据,如同步记录和分析眼球运动轨迹和关注焦点、脑电和事件相关电位、心电、肌电、皮肤电等生理信号。多模态整合分析可以使实验结果更加客观和全面,能够更深入地揭示学习者的信息感知和认知加工规律(Merceron et al.,2016)。吴永和研究员进一步提出学习分析的“源息性”问题,即收集哪些数据以及如何分析才能保证学习分析源数据能准确全面地体现学习者的全部特性。他认为多模态学习分析为解决这一问题提供了有效的途径。所谓多模态数据是指对于同一现象、过程或环境,采用多种方式获取的相关数据。互补性是多模态数据的重要特性,任何一种模态的数据都能提供关于某一现象或过程的部分解释,而这些信息从其他模态数据中无法获得(Lahat et al.,2015)。
在谈到大数据在教育研究中的应用趋势时,一方面,我们可以借鉴大数据在商业营销、电子商务、社交传媒等其他行业的经典案例和成熟的数据挖掘方法,例如采用类似“啤酒尿布”案例的关联分析,针对不同学习过程,识别学习者的行为模式,建立学习行为和学业表现的关联;采用类似购物网站自动推荐的分类预测算法,对学生群体进行分类,对学业水平进行归因分析,以更好地理解和预测学习表现;采用数据驱动的知识发现方法,面向不同学习阶段,对个体的学习成长进行学习者画像,以深入了解学生的学习特质(顾小清等,2012)。另一方面,我们也需要注意到教育问题本身的复杂性以及与其他领域的差异性,分析总结具有教育行业特色的学习分析和教育数据挖掘方法。如武法提教授所列举的一系列学习分析的典型应用,包括学业成绩趋势分析、学习投入度模型验证、认知分析、思维过程分析、知识地图、学习路径、兴趣图谱、社会关系图谱、学习分析仪表盘等,都可视为面向教育领域需求和问题的分析产物与解决方案(武法提等,2014)。
教育信息化从上世纪80年代萌芽到90年代发展,经历了电视、卫星和网络。从电化教育、远程教育到现在的慕课、翻转课堂、云教室以及三通两平台,教育信息化发展的思路沿袭了管理信息化的发展思路。当前提出的“互联网+教育”理念可以视为教育信息化2.0时代的到来,其特点在于“用户至上”和“设计思维”,即关注学习的过程和学习者的体验,关注构建开放的、迭代设计的、需求导向的教育生态系统。但是教育信息化2.0的这两个特点需要我们重构教育理论框架,通过教育心理学、教育学、教育哲学、教学论、课程论、考试测评理论、教育管理、教育统计、教育经济和教育信息化等学科间的合作研究,提出新的理论和新的研究范式,以满足互联网时代因数据而重塑教育的需要。虽然与会专家基本都认同教育大数据将重塑教育的未来,驱动教育领域研究和实践的持续创新,但是Michael Spector教授站在教育技术发展的历史视角,提醒大家在研究和应用教育大数据的过程中仍然应该保持更谨慎的态度,不宜过分夸大新技术对教育的影响(Spector,2014;程薇等,2015)。