作者:曹培杰
深化新时代教育评价改革,是加快建设高质量教育体系的关键一环,在教育领域综合改革总体布局中占有举足轻重的地位。随着国家教育数字化战略行动的深入推进,人工智能、大数据等新技术加速融入日常教育教学,并正在成为撬动包括学生综合素质评价在内的教育评价改革的重要支点,为破解长期存在的评价难题提供了新的可能。
数字技术为教育评价提供了新的思路方法
【资料图】
进入21世纪后,计算机、互联网开始应用于教育评价,催生了计算机自适应测验、网络问卷调查、电子档案袋等新型评价技术,为教育评价带来了可喜变化。但不可否认的是,这些评价技术并没有真正跳出标准化测验的框架限制,再加上应用范围远小于试卷等传统测评工具,对教育评价发展全局影响有限。即便是侧重于评价学生成长过程的电子档案袋,也大多停留于材料记录层面,主要作为标准化测验的补充参考。
当前,教育评价仍然以纸笔测试为主,重点是考查学生的基础知识和基本技能,信息来源较为单一,评价反馈相对滞后,已不能完全满足新时代教育发展的需求。随着新一轮科技革命的加速演进,数字技术成为新时代教育改革发展的引领力量,为教育评价提供了新的思路和方法。
教育评价将从“知识导向”转向“能力导向”。在数字技术支持下,通过设置真实性的模拟任务情境,着重考查学生的问题解决能力、知识迁移能力和实践创新能力,突破传统教育评价对分数的过度关注。比如,利用人工智能和虚拟现实技术,开展模拟仿真、教育游戏、虚拟任务场景、协作学习环境等新型评价方式,在具体任务情境中进行深层次考查,更好地了解学生综合运用各种知识解决实际问题的能力。
教育评价将从“结果视角”转向“过程视角”。通过覆盖学习全过程的大数据采集,持续为学生提供针对性的诊断报告,制定精准的教育改进方案,满足学生的多样化成长需求。比如,利用学习分析技术建立模型,收集学生学习的过程性数据,提供可视化的“学习体检表”,跟踪评估学生的认知特征、能力表现、内在潜能等,为学生提供最优化学习方案。
教育评价将从“单一分数”转向“综合素养”。通过建立学生综合素质评价模型,对不同学生实行差别化评价,不再用同一把尺子衡量所有学生,鼓励学生发展特长。比如,利用数字画像技术,全面展现思想道德、身心发展、学业水平、审美情操、劳动技能等方面情况,坚决克服重智育轻德育、重分数轻素质等功利化行为,促进学生身心健康、全面发展。
学生综合素质评价数字化不能为了技术而用技术
近年来,许多中小学校利用数字技术开展学生综合素质评价创新,探索开展学生各年级学习情况全过程纵向评价、德智体美劳全要素横向评价,形成了系列经验做法。与此同时,一些学校在包括学生综合素质评价在内的教育评价数字化实践探索中遇到了新问题、新挑战:数字技术不仅没有成为教育评价改革的利器,反倒强化了传统教育评价的弊端;利用数字技术开展教育评价本应减轻教师负担,结果却让他们陷入了填数据、报数据的泥潭,许多一线教师对此苦不堪言。究其根源,就在于数字技术应用与教育评价改革还是“两张皮”,没有真正实现深度融合。
教育评价数字化不仅是技术工具的数字化转型,更是评价标准的数字化转型。教育评价具有重要的指挥棒作用,无论用人工智能技术,还是大数据技术,都不会改变教育评价的本质功能。这种指挥棒作用,集中体现在评价标准上,有什么样的评价标准,就有什么样的评价导向。遗憾的是,一些学校引入数字技术后,并未对教育评价标准进行相应调整,仍然以知识性考查为主,把过去的纸笔测试变成现在的“机器测试”,更加精准地开展考试排名。在推进教育评价数字化过程中,一定要把“新技术”和“新标准”结合起来,减少事实性知识、概念性知识类指标,增设程序性知识、元认知知识类指标,进一步聚焦学科核心素养,突出强调学生整合运用知识解决复杂性、挑战性学习任务的能力,着重发展学生批判性、创造性思维品质,让数字技术成为构建新型教育评价体系的“催化剂”。
学生综合素质评价数字化不能为了技术而用技术,也不是技术用得越多越好,更不能把教育评价变成“炫技”的舞台。许多学校积极运用数字技术推进教育评价改革,出现了智能化评价终端、教育大数据平台等,这些技术提高了教育评价效率,一定程度上缓解了“唯分数”倾向。然而,我们也看到,旨在增效的教育评价数字化改革在实践中却可能会增加教师负担,产生“技术性增负”的悖论。在数字技术的加持下,教育评价指标更加细分,数据填报贯穿教学始终,新技术新平台被异化成随时随地下任务、发指令、填表格、报数据的工具,使一线教师处于高度紧张状态。
在推进学生综合素质评价数字化过程中,一定要把数据自动化采集分析作为重中之重,加强不同平台系统之间的衔接,建立统一数据标准;评价指标设计尽量精简,追求用最少指标实现评价目标,支持根据不同评价场景共享使用和自动调用数据,避免出现重复收集数据的现象;配置自动传感器和可穿戴设备,利用智能手环、智能手表、智能运动装备等,在自然情境中采集个人运动及身体健康数据,实现伴随学生成长全过程的即时评价;结合校内外数据进行关联分析和多重校准,提高教育评价数据挖掘的深度和广度,让数字技术成为家校社协同育人的“助推器”。
强化数字技术支撑,发挥综合素质评价功能
综合素质评价是发展素质教育、转变育人方式的重要制度,对于克服功利性考试弊端、撬动学校育人方式变革具有重要引领作用。综合素质评价注重全过程记录、结构化呈现学生的成长状态,在促进学生德智体美劳全面发展上具有优势,受到了广大中小学校的普遍关注。但在实践中,综合素质评价却面临着工作量大、任务烦琐、公正性难以保证等问题,特别是数据采集能力不足、数据分析深度不够问题凸显。强化数字技术支撑,是充分发挥综合素质评价功能的重要依托。
第一,迭代式模型构建。过去,构建综合素质评价模型主要从教育学理论出发,带有很强的理想性和超越性,一些评价指标设计“不太接地气”,很容易就会陷入“看起来很美、做起来很难”的尴尬境地。未来,构建综合素质评价模型应整合教育学、心理学、计算机科学等专业力量,聚焦思想品德、学业水平、身心健康、艺术素养、社会实践五个维度,形成一整套强共识、可解释、广覆盖的评价指标体系。同时,依托人工神经网络、关联规则学习、生成对抗网络等算法模型,从大量数据分析中提取有效的评价规则,开展智能精准的指标筛选和权重计算,推动综合素质评价模型不断迭代优化,更好适应各类复杂教育场景。
第二,多模态数据采集。过去,综合素质评价的数据采集基本局限于学校教育场景,并高度依赖于考试测验、问卷调查、档案记录等传统方式。未来,综合素质评价将充分发挥智能终端、可穿戴设备、智慧教育平台等技术优势,在真实情境下开展伴随式数据采集,除了采集文字信息的单一模态数据,还能采集音频、视频、心理指标、生理信号等多模态数据,全方位呈现学生成长过程的关键时刻和典型行为,实现对学生综合素质发展的横纵向追踪和全过程动态分析。同时,超越学校教育场景,注重从家庭场景和社会场景形成新的数据源,以家校社协作的方式采集睡眠时间、运动频率、课外劳动时长、社会实践次数等相关数据,共同推动德智体美劳全面培养的学生综合素质评价有效落地。
第三,智能化结果分析。过去,综合素质评价结果以经验解释和主观判断为主,由于受社会环境、文化特征、信用体系等因素影响,综合素质评价在结果分析过程中不可避免地隐藏着不公平的风险,甚至引发公众质疑。未来,综合素质评价应从经验判断走向数据驱动,针对不同来源、不同类型、不同结构的数据信息建立标准化规则体系,利用人工智能、大数据等技术对多模态数据进行深度挖掘分析,进一步揭示背后蕴含的内在规律和影响关系,更好地把握学生成长状态和教育改进需求。同时,实施有温度的数字化教育评价,把学生当作独一无二的个体,综合考虑学生的起点水平、个性特征、心理状态及家庭社会因素,充分发挥评价结果的导向、鉴定、诊断、调控和改进作用,让每个学生都出彩。
(作者系中国教育科学院未来教育研究所副所长,本文是中国教育科学研究院基本科研业务费专项资金项目“人工智能时代未来教育变革的基本特征和发展趋势研究”[课题编号:GYC2022007]的研究成果)