摘 要:教育评价改革是驱动新时代基础教育高质量发展的关键抓手。学生评价作为教育评价体系的重要组成部分,其改革成效直接关系到育人质量的提升。本文首先明确了学生评价涵盖结果性评价、综合素质评价与日常学习评价三个基本范畴。在此基础上,确立学生评价的核心目标应包括确保党的教育方针有效落实、满足国家科技创新与人才选拔的战略需求、倒逼育人方式革新以及推进教—学—评一体化实施。在学生评价改革实践中,需协同推进考试形式与内容改革,完善综合素质评价机制,充分发挥作业的日常评价功能,并以信息技术赋能评价改革,引导评价回归育人本质,从而为教育强国建设提供有力支撑。
关键词:学生评价;育人方式;核心素养;综合素质评价;教育评价改革
引 言
建设教育强国是全面建成社会主义现代化强国的战略先导,而基础教育作为国民教育体系的基石,其质量直接关系到国家发展的根基。在此背景下,基础教育评价改革不仅关乎教育的发展方向,更是决定教育强国建设成败的关键环节。2018年9月,习近平总书记在全国教育大会上的重要讲话指出,要扭转不科学的教育评价导向,坚决克服唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,从根本上解决教育评价指挥棒问题[1]。学生是教育评价的主体之一,因此学生评价改革也成为教育评价改革中重点与难点并存的关键环节。2020年10月,中共中央、国务院印发的《深化新时代教育评价改革总体方案》(以下简称《总体方案》)明确提出,要改革学生评价,促进德智体美劳全面发展,并进一步强调要坚决改变用分数给学生贴标签的做法,创新德智体美劳过程性评价办法,完善综合素质评价体系[2]。然而,当前学生评价实践中仍存在若干突出问题。首先,中考和高考的选拔性功能被过度强化,导致学生的学业竞争压力持续增大,不仅引发心理健康隐忧,也挤压了学校全面育人的空间[3-4]。其次,全面的教育质量评价体系尚未健全,重智轻德、唯分数、唯升学的现象依然存在[5],在德育、美育、体育和劳动教育以及高阶思维、问题解决与创新能力等方面,仍缺乏科学有效的评价方法[6]。再次,过程性评价与增值评价仍存在明显不足。由于大量形成性数据处于碎片化状态,学生成长、教师发展和区域教育变化的系统性数据难以被有效整合利用[7]。这种局面既导致缺乏将数据转化为过程性评价的有效模型,也使得建立科学基准线并进行跨年度持续追踪变得困难,教育质量的真实提升程度因而无法被准确衡量。最后,面向学生的个性化测评以及针对特殊学生群体的评价机制仍较为薄弱。当前学生评价仍以大规模标准化考试为主,未能充分关注学生个体的特点与发展潜力[8],对特殊需求学生也缺乏应有的认知与支持。此外,受不同地区经济和教育发展水平的影响,个性化教育方案落地困难[9],制约了教育公平与质量的提升[10-11]。为破解上述困境,亟须转变评价理念,加快推进学生评价改革进程,推动教育评价回归育人本质。尽管现有研究已对学生评价改革的现状与理念展开探讨[12-13],但对具体内容、核心目标及如何引发育人方式变革的学理探讨仍显不足。为此,本文在厘清学生评价改革基本范畴和核心目标的基础上,提出了实践路径,以期为推动新时代基础教育高质量发展提供理论参照与指引。
一、学生评价改革的基本范畴
在建设教育强国的背景下,学生评价改革必须回应“培养什么人、怎样培养人、为谁培养人”这一根本问题。其改革实践应以厘清基本范畴为出发点,引导学生评价向全面育人转型,确保教育的正确发展方向。基于当前学生评价现状,改革需全面覆盖结果性评价、综合素质评价与日常学习评价三个基本范畴。(一)结果性评价结果性评价在学生评价体系中长期占据重要地位,中考、高考等大规模考试即是典型代表。结果性评价通常在一个相对完整的学习阶段(如初中或高中)结束后,对学生的学习成果进行系统性评估,其核心功能在于甄别与选拔,同时也对教育教学质量起到阶段性检验作用。由于强调以预设的课程目标和内容标准为唯一尺度来衡量学生的学习成果,结果性评价通常以课程标准和教学目标为依据,以高度标准化的测验为主要工具,侧重考查学生对易于量化的基础知识与基本技能的掌握情况[14]。这种评价方式具有效率高、可比性强的优势,在保障教育公平和基础质量方面发挥着不可或缺的作用。然而,其局限性也日益显现:一方面,难以有效测量分析、综合、创造等高阶认知能力;另一方面,对学习过程中的情感态度、探究精神等内隐品质难以准确捕捉。更为关键的是,过度依赖结果性评价极易引发应试教育倾向,导致教学被窄化为对考试内容的机械重复训练[15]。因此,当前高考与中考改革的核心方向,是在确保选拔公平性的基础上,积极探索增加试题的开放性、探究性与综合性,以全面融入核心素养考查。(二)综合素质评价综合素质评价关注学生发展过程,是过程性评价的重要实践形式[16]。它突破了传统上依赖学业成绩的单一评价框架,注重对学生在学习过程中的认知能力(如学业水平)与非认知能力(如思想道德素养、学习动机、身心健康、社会实践)进行动态追踪与综合评价[17]。与仅能反映部分学习结果的传统纸笔测试相比,综合素质评价为发现和培养学生的多样化潜能提供了更为全面的路径。在政策层面,综合素质评价具有明确的导向性。《教育部关于加强和改进普通高中学生综合素质评价的意见》《总体方案》等文件为其构建了基本框架,强调应系统记录学生在思想品德、学业水平、身心健康、艺术素养与社会实践等方面的发展情况[18,2]。在实践层面,通过建立学生成长档案,将学生的研究性学习报告、社会实践经历、志愿服务时长等材料纳入评价体系,能够较为完整地描绘出学生的个性特质与成长轨迹。同时,通过引入学生、教师、家长、学校等多元主体参与评价,有助于系统评估学生在发展过程中展现的个性特质和潜在能力。凭借多元评价内容与主体参与,综合素质评价发挥育人导向作用,引导教育教学转向对学生德智体美劳全面发展的重视,促进教育评价的功能从甄别选拔向全面育人转变[19]。综合素质评价在具体实施中尚面临诸多挑战。受评价理论和方法尚不成熟等因素制约[20],其核心问题在于如何确保记录的真实性和评价的公正性,防止评价流于形式或可能引发新的不公平现象。因此,推动综合素质评价真正落地的关键在于实现程序公正和结果使用公平的有机结合。通过建立公开透明、可信可查的操作规范,将评价结果科学、实质性地纳入升学评价体系,才能充分发挥其在落实立德树人根本任务中的导向作用。(三)日常学习评价日常学习评价聚焦于教育教学过程中的微观层面,是一种嵌入教学过程、持续性的诊断与反馈方式。其形式不仅包括课堂测验和日常作业,也广泛涉及课堂观察、提问、讨论、自我评价与同伴互评等多种方式,旨在及时诊断学生对所学内容的掌握情况,并为教师调整教学策略、学生开展自主学习提供依据[21]。一方面,教师基于日常学习评价,可以准确识别学生在相关知识理解与能力发展中的薄弱环节(如对课堂测验中的错误作答题目进行归类分析),从而及时优化教学策略,形成教—学—评一体化的良性循环[22]。另一方面,学生基于日常学习评价反馈,可以对自身在学习过程的优势与不足形成清晰认知,进而有针对性地强化长处、弥补短板,逐步养成自主管理、持续反思的学习习惯。由此可见,日常学习评价作为一种持续、动态且及时的评价反馈方式,是实现教育教学目标的重要支撑。在教育数智化转型背景下,以经验驱动的学生学习分析既面临现实困境,也迎来新的发展机遇。为促进学生个性化发展,经验驱动的学习分析、数据驱动的学习分析以及主体感知的学习投入分析呈现融合发展趋势[23]。与此同时,智慧教室和自适应学习平台等学习场景的升级与广泛应用,正显著提升日常学习评价的效能。这类新型学习场景能够自动记录并分析每位学生的答题数据与学习路径,生成个性化学习报告并推荐适配的学习资源,进而将形成性评价推向规模化与精准化的新阶段,真正构建起教—学—评一体化的良性循环生态。
二、学生评价改革的核心目标
学生评价改革旨在通过评价机制的系统性调整,切实落实立德树人根本任务。为实现这一根本要求,必须首先厘清改革的三个核心目标,即促进党的教育方针贯彻落实,服务国家人才培养与选拔的战略需求,推动育人方式的深层变革。学生评价改革应服务于这三者共同构成的系统性目标,从而保障教育的正确发展方向。(一)通过考试评价促进党的教育方针贯彻落实考试是学生学习过程中不可或缺的环节。传统考试在功能上局限于人才选拔,缺乏对学生发展过程的全面考查,难以对学生的整体性成长做出科学合理的评价。2002年印发的《教育部关于积极推进中小学评价与考试制度改革的通知》明确指出,中小学评价与考试制度改革应全面贯彻党的教育方针,从德智体美等多方面综合评价学生的发展[24];2014年,《国务院关于深化考试招生制度改革的实施意见》进一步强调,要把促进学生健康成长成才作为改革的出发点和落脚点,扭转片面应试教育倾向,坚持正确育人导向,践行社会主义核心价值观,深入推进素质教育,培养德智体美全面发展的社会主义建设者和接班人[25]。一方面,核心素养是对党的教育方针的具体化呈现,通过将学科领域的教育目标转化为学生个体的发展目标,明确社会主义建设者和接班人应具备的基本素质。另一方面,核心素养也是落实立德树人根本任务的关键桥梁,在党的教育方针与具体教育教学实践之间建立起有机衔接[26]。因此,教育评价亟须从“知识本位考试”转向“素养本位评价”,以此为牵引推动党的教育方针落地,引导育人方式变革。(二)立足三位一体,服务国家科技创新与人才选拔学生评价应依据高校专业特色与发展需求,选拔具备学科潜力与创新素养的人才。习近平总书记在党的二十大报告中明确提出,“坚持教育优先发展、科技自立自强、人才引领驱动,加快建设教育强国、科技强国、人才强国,坚持为党育人、为国育才,全面提高人才自主培养质量,着力造就拔尖创新人才”[27],将教育、科技、人才三位一体统筹部署为国家发展的基础性战略支撑。在这一政策方针指引下,学生评价必须突破传统单一维度的评价框架,遵循三者协同联动的核心逻辑,即以教育评价改革衔接人才培养与科技发展需求,以科技导向校准评价维度,以人才标准锚定评价目标。随着我国高等教育进入普及化阶段,学生评价在实践层面需精准对接三位一体战略下的双重需求:一方面,要服务于国家科技创新与自立自强,通过在评价中纳入创新思维、问题解决能力等关键素养,引导基础教育阶段重视科技创新导向的核心能力培养;另一方面,要赋能人才选拔,构建与高校专业特色和学科建设方向相匹配的评价体系,在育人导向的基础上,为高校精准识别具有学科潜力与创新特质的拔尖人才提供科学依据,推动评价从“选拔分数”向“培育潜力”转变,最终实现教育培养、科技发展与人才选拔的有机贯通。(三)倒逼育人方式变革,促进教—学—评一体化在新时代背景下,学生评价不应以单纯依赖分数的竞争性选拔和对静态结果进行终结性判断为主要目的[28],而要通过评价(如考试)帮助教师与学生识别在教学和学习过程中存在的问题。一方面,评价结果可为教师提供学生学习情况的客观反馈,推动其反思并优化自身教学方式,实现教学策略的动态调整;另一方面,评价也应服务于学生的个性化成长和自主学习能力发展,促进其核心素养的持续提升。为实现这一目标,需要从三个方面系统推进。一是要深刻把握各学科教学的重点、深度和广度。应根据各学科的特性,明确不同学段的教学侧重点,并基于国家课程标准界定各知识内容在不同学段的学习深度与广度,平衡好二者之间的关系。二是为学生核心素养发展提供跨学科教学参照。跨学科的核心素养评价通常涉及多学科知识的整合与运用。例如,新课程改革倡导的桥梁建设项目等综合实践活动,即融合了机械工程、计算机科学、材料学、经济学等多学科内容[29]。教育科研人员应加强跨学科教学理论与实践研究,开发系统化的教学案例,为一线教师设计跨学科学习方案提供专业支持。三是鼓励并帮助教师开展跨学段课程的一体化设计与实施。学生核心素养的形成是一个长期、渐进、累积的过程,跨学段课程的整体规划有助于统筹各学段的学习目标与内容,避免学生素养的培养过程中出现断层或低水平重复,确保学习过程兼具连贯性和螺旋上升性[30]。综上所述,学生评价应有机内嵌于教学与学习过程之中,而非在其结束后实施。教学、学习与评价三者应共同指向统一的教育目标[31],形成以学生发展为主轴,教—学—评循环互动、协同促进的完整闭环。
三、学生评价改革的实践路径
为破解学生评价改革在实施方面存在的问题,服务我国基础教育评价改革进一步深化的整体需求,当前应聚焦学生评价的三个基本范畴协同发力,系统性推动改革举措的有效落地。(一)协同推进考试形式与内容改革作为教育评价中的重要环节,教育考试与学生评价息息相关,应从考试形式与考试内容两方面协同推进改革。第一,稳步推进考试形式改革。当前考试形式多以纸笔测试和单一学科测验为主,存在明显局限。一方面,此类考试通常侧重结果导向,教师仅能观察到学生作答的最终结果,难以获取其作答过程中的重要信息;另一方面,单一学科考试虽能反映学生在特定学科知识点上的掌握情况,却割裂了学科间的内在联系,不利于培养学生的综合问题解决能力。为全面评价学生的核心素养,应推动考试形式向多元化、综合化转型,如开发基于真实情境的综合性试题、将过程性评价和总结性评价相结合、设计跨学科考试以及开展多样化的表现性评价等。需要注意的是,考试形式改革需综合考量社会接受度、教育教学发展水平及教育测量技术的科学运用。在改革过程中,应坚持稳步推进策略,待某项措施成熟之后,再推进下一项措施,不应操之过急。否则,不仅难以发挥考试对教育教学的良性导向作用,还可能对教育公平与社会稳定造成负面影响。第二,加快推动考试内容变革。内容改革是考试制度改革的核心,《总体方案》明确指出“构建引导学生德智体美劳全面发展的考试内容体系,改变相对固化的试题形式,增强试题开放性,减少死记硬背和‘机械刷题’现象”[2]。传统考试内容侧重对低阶认知能力(如知识记忆、理解与应用)的考查,而对高阶认知能力(如分析、综合与评价)的考查则相对匮乏。随着育人目标向核心素养导向深化,考试内容应从低阶知识向高阶认知转变,重视考查学生在真实情境中应对问题的能力,如创新能力、复杂问题解决能力等高阶思维素养。基于此,考试内容设计应立足现实世界,依托真实问题情境,引导学生将现实问题转化为学科问题,运用相关学科知识构建模型并解决问题,最终将所得结果置于真实情境中进行合理解释与验证。第三,坚持以课程标准为指导。课程标准明确了考试所应涵盖知识内容的广度与深度。《普通高中课程方案和语文等学科课程标准(2017年版)》和《义务教育课程方案和课程标准(2022年版)》均包括具体化的教学目标、学科课程内容标准、教学建议和学业质量标准四个部分[32-33]。教学目标和学业质量标准集中体现对学生核心素养的发展要求,课程内容标准明确界定应培养的核心素养范畴,教学建议则聚焦于核心素养的培养路径与策略。总体而言,课程标准中对学科核心素养的系统界定与要求为教育教学与考试评价提供了指导。以北京高考特色命题实践为例,北京市在高考命题中强调“四个突出”和“四个考出来”核心理念。“四个突出”指突出立德树人、突出主干知识、突出学科思想与方法、突出北京学生特点;“四个考出来”则指把社会主义核心价值观与中华优秀传统文化考出来、把学生课堂表现考出来、把学生实践能力考出来、把学生创新精神考出来。在该命题理念引导下,北京高考逐步实现了三个转变:一是考试功能定位转变,从选拔工具转向全面育人载体;二是教考关系转变,从教考博弈走向教考良性互动;三是命题立意转变,从能力导向转向素养导向[34]。这些转变突出了以学生为中心的教育理念,使高考命题同时具备选拔、育人、价值引领与激励作用,符合新时代教育和考试评价改革的方向。(二)完善学生综合素质评价对学生综合素质进行科学评价,始终是我国教育评价改革的重点领域。从2014年《国务院关于深化考试招生制度改革的实施意见》到2019年《中共中央国务院关于深化教育教学改革全面提高义务教育质量的意见》,再到2020年《总体方案》,一系列政策文件中均对学生综合素质评价做出了系统阐述和持续强调。综合素质评价旨在全面反映学生在德智体美劳各方面的发展情况,是学生毕业与升学的重要参考,其核心价值在于打破“唯分数”和“一考定终身”的传统局限,促使教育关注点从单纯的备考回归至日常教育教学当中,从单一考试结果转向对教与学过程的持续性评估。从教育治理的视角来看,将学生综合素质评价结果切实纳入学校的招生参考依据,能够有效引导各级政府和教育行政管理部门积极为学生创设多样化的发展平台与教育资源,提供更多展示其综合素质的机会。这一评价机制不仅有助于缩小城乡教育差距,也对促进教育整体公平具有深远意义。开展学生综合素质评价目前主要面临四个方面的难题。首先,对综合素质评价功能的理解仍有局限。许多人仅将综合素质评价视为考试与评价制度改革的附属产物,其主要功能被窄化为服务高一级学校招生。其次,对于应采集哪些信息作为综合素质评价的内容尚不清晰。例如,哪些指标适于定量刻画,哪些宜作定性描述,尚未形成明确结论。再次,在数据采集方法上存在技术局限,尤其是如何确保采集资料的真实性与客观性,目前仍缺乏系统、科学、可操作的模式和方法。最后,综合素质评价结果的使用机制尚不健全。例如,综合素质评价结果应与中高考招生录取实行“硬挂钩”还是“软挂钩”、从哪些环节与招生类别融入录取流程等问题,目前尚未达成明确共识。在新时代背景下,需要从三个方面重新审视综合素质评价。第一,要明确国家对综合素质评价的功能定位与政策要求。综合素质评价既是当前教育评价改革的关键任务,也是基础教育改革的目标方向[35],其核心意义在于推动育人方式的变革。这需要构建全方位、多层次、立体化的评估体系,其评价结果应有效服务于学生的个性化发展,重在激发与培养学生内在潜能,而非仅局限于招生录取的单一维度。第二,要准确把握综合素质评价的基本原则。一是超越招生功能,坚持育人导向。综合素质评价的根本目标在于促进学生在思想道德、学业成绩、身心健康、艺术素养和社会实践等方面的全面发展,而非仅服务于招生录取[18]。二是关注过程表现,突破结果性评价局限。综合素质评价应关注学生在学习活动中的参与过程、成长轨迹与发展状态,而非仅看重最终学习成果。通过对学习过程的系统观察,可以更科学、全面地把握学生在元认知、认知能力和非认知能力等方面的真实发展状况。三是尊重个体差异,倡导多元发展。综合素质评价应充分尊重学生之间的个体差异,允许并鼓励学生在不同领域展现其潜力与特长,为个性化成长提供空间与支持。四是推动评价内容课程化与课程内容评价化。综合素质评价应将评价内容深度融入课程教学与学生学习的全过程,有机嵌入自然发生的教与学场景,而非另行搭建独立于日常教学之外的评价体系。这有助于打破教学、学习与评价三者之间的壁垒,减轻评价任务给师生带来的额外负担。五是审慎使用分解式指标体系。当前的评价实践通常将某一评价目标拆解为若干细分指标,试图通过学生在各具体指标上的表现推断其在上位概念层面的整体发展水平。这种基于“局部之和等于整体”逻辑的评价方法虽便于操作,但在实际应用中往往难以通过局部表现的简单叠加准确反映学生发展的整体性与复杂性。因此,有必要引入领域专家集体评议机制,对学生的整体素养表现进行综合评定。第三,健全综合素质评价的内容与方法。综合素质评价应同时关注学生认知领域与非认知领域的学习结果。认知领域的评价内容主要涉及知识理解、技能掌握与实际运用。除传统考试外,可以在宏观层面依据课程标准对学生群体进行等级划分,以反映其素养能力水平;在微观层面,可以借助学习进阶理论追踪并分析学生的学习路径[36],为其提供具有针对性的学习改进建议。此外,随着信息技术与教育评价活动的深度融合,动态呈现学习任务、采集与挖掘学习过程中的数据已成为可能,从而能够深入了解学生的学习模式与认知特征[18]。非认知领域的评价内容涵盖跨学科主题、情感态度与价值观等方面,如气候变化对本地生态系统的影响等具有现实意义与不确定性的(跨)学科议题,调研某地生态系统现状并提出科学性、可行性和发展性建议的社会实践活动评价等。同时,应建立以核心素养发展为目标的学生成长记录与档案袋评价机制,并不断创新评价技术与方法,有效提升非认知评价的真实性与结果可比性。(三)重视发挥作业的日常评价功能与考试相比,作业具有灵活性、及时性、个性化与系统性等鲜明特点,这些特质使其在过程性评价中具有独特优势。2021年,中共中央办公厅、国务院办公厅印发的《关于进一步减轻义务教育阶段学生作业负担和校外培训负担的意见》指出,要提高作业设计质量,发挥作业诊断、巩固、学习分析等功能,并鼓励布置分层、弹性和个性化作业,坚决克服机械、无效作业,杜绝重复性、惩罚性作业[37]。该文件从国家政策层面明确了作业在教育评价改革中的作用和定位。实践中,作业成为学生负担的原因有两个:一是作业的数量、难度与学生实际能力之间存在不匹配问题;二是作业所隐含的学业期待和评价特征容易引发学生的焦虑等消极情绪。因此,减轻作业负担不能仅靠简单地减少作业量,而应从作业的结构设计、内容选择与形式创新等方面入手,系统推进作业质量的整体提升[38]。为充分发挥作业在日常评价中的应有功能,应从两方面进行改革与创新。第一,推动作业目标的根本性转变,从当前巩固知识、提高成绩转向以培养学生关键能力和必备品格为核心目标。首先,强化作业的诊断功能。通过分析学生的作业完成情况,及时识别其在核心素养掌握过程中的优势与不足,并为后续教学改进提供依据。其次,重视作业的发展功能。作业本质上是一种高阶思维的学习活动,应通过设计具有挑战性、开放性的作业任务,培养并考查学生的批判性思维、问题解决和创新能力[39]。最后,充分发挥作业的激励功能。一方面,通过引入创新型作业,增强学生在学习过程中的探究性、创造性、开放性和参与愉悦感,使作业具有全新教育意涵,激发学生的主动探索兴趣[40]。另一方面,推进个性化作业设计,使作业类型和难度与学生个体的认知水平、兴趣特长与能力基础等相匹配,确保学生在完成作业时既不会因过于简单而失去兴趣,也不会因过于困难而失去信心,从而有效维持学生的学习兴趣和动机。第二,推动作业功能的系统性创新,主要包括内容创新和实施创新两条途径。在内容创新方面,题目设计应超越对基础概念的机械操练,以发展学生高阶思维、生成性思维为核心目标。这要求从作业目标、测评框架、命题方法到分析结果运用形成多角度、系统化设计方案,对教师的专业能力提出了更高要求。具体而言,作业目标既要以课程目标为依据,也要与教学目标相互衔接、相互支撑。作业框架应系统规划拟测评的课程核心素养、学科内容、任务情境、题目类型、难度分布等维度,明确考查内容、难度层级与题目形式之间的基本结构、权重分配与对应关系。在明确作业目标和框架的基础上,再进行作业题目的命制。作业题目应融入具有学科特征的真实情境,依托现实中的现象、事件或场景创设具有现实意义的任务,并根据具体考查目标灵活整合与创编题目内容。为更好评估学生的高阶思维,作业类型应以分析性(如讨论和辩论)、评价性(如同伴互评)和创造性(如开放式问题解决)等活动化任务为主。在实施创新方面,应超越常规的学生做、教师讲模式,积极依托数字化平台,促进全体学生共同参与、展示生成、互评反思的协同功能发展。作业不应仅是学生被动完成的学习任务,而应成为同伴、小组、师生之间互动交流及学生自我价值实现的载体。此外,实践中应系统重构作业流程、实施环境与支持工具,探索与教学过程深度融合的作业模式,鼓励全体教师开展创新探索。例如,可利用智慧课堂系统为教师提供课堂反馈、测验评估、奖励机制、作业管理等工具,提升作业实施效率。需注意的是,由于不同作业的特点及学生个体差异,在作业的实施过程中,应对组织形式、匿名设置、评价方式、评价标准、评价主体、评价对象、答案呈现方式等要素进行差异化设计与灵活调整。(四)强化信息技术赋能学生评价改革《总体方案》明确提出,利用人工智能等现代信息技术,实现对学生学习全过程的纵向评价[2];《教育强国建设规划纲要(2024—2035年)》则进一步要求建立以人工智能和大数据为支撑的教育评价体系,深化新时代教育评价改革[41]。信息技术的快速发展推动着教育测评技术的丰富和革新。在形式上,测评已逐步从传统纸笔测验转向计算机化测验、交互式/虚拟化评价等;在数据类型上,已从单一的作答结果扩展至涵盖行为、生理信号等的多模态数据。在这一转型过程中,信息技术从三个方面发挥着关键性支撑作用。一是为突破学生评价改革实践的瓶颈提供路径。利用大数据与人工智能等技术手段,可解决核心素养导向下学生评价所面临的许多现实问题。例如,利用虚拟现实(VR)与增强现实(AR)技术创设高度仿真的问题情境,记录学生作答的过程性数据,评估学生的问题解决能力、创新能力等高阶思维能力;又如,利用可穿戴设备、图像识别、语音识别等技术,客观记录学生在体育锻炼、艺术创作和劳动实践中的表现,实现对学生体美劳素养进行过程性评价;再如,基于图像和语音识别技术,系统采集学生在课堂学习中的行为反应、学习轨迹等过程性数据,为构建学生个体成长模型、实现增值性评价提供实证依据。此外,依托大数据技术还可识别学生的学习风格、行为特征及发展潜力等,为个性化教学提供科学依据。总结而言,信息技术在精准测评学习结果、立体刻画学习过程、高度拟真评价情境、及时反馈评价结果等方面具有巨大潜力。二是推动学生评价的数字化转型。信息技术正全面渗透至学生评价的各个环节,包括题目生成与呈现、学生作答、数据采集和存储、结果分析与反馈等。学生评价的数字化转型主要体现在三个方面。其一,构建多模态、多渠道的评价数据采集体系。例如,依托5G和物联网技术实现人、机、物的广泛互联,为采集多维过程数据和环境信息提供基础;借助图像识别、语音识别等智能感知技术,自动捕捉学生的动作、表情、语音、语调等信息,为评价提供更为客观、连续的过程性依据。其二,推动测评形式的多样化发展。在人机协同时代,测评形式日趋丰富,如计算机自适应测评、人机交互式测评以及基于真实情境的体验式测评等。我国基础教育质量监测借鉴PISA等国际大规模测评中使用的人机交互式任务、计算机自适应测验系统等对学生的复杂问题解决能力、阅读素养、科学探究能力等进行评估[42-43],由此生成多渠道、多模态的数据,推动评价重心从学习结果向学习过程转向。其三,强化评价数据的分析与反馈功能。借助大数据与学习分析技术,能够基于测评任务特征和学生作答情况,准确评估其核心素养发展水平并提供个性化学习反馈,有助于解决学习过程中存在的问题。例如,有研究将神经网络和认知诊断模型相结合,通过提取知识技能、任务难度、关键词等特征,结合注意力机制进行建模,实现对学生在问题掌握程度上的预测[44]。三是关注教育测评的效度、伦理及安全问题。信息技术在赋能教育测评的同时,也带来了效度可信性、数据伦理、系统安全以及测评公平性等多重挑战。首先,在使用人工智能与机器学习技术对学生各方面数据进行挖掘分析时,算法机制往往处于“黑箱”状态,处理过程的可解释性相对较差;此外,当前多数人工智能与机器学习方法依赖数据驱动,缺乏有效的理论框架支撑,导致测评结果的效度难以得到保障。因此,如何建立效度验证框架用以指导基于机器学习的新型评测方式,使其符合教育测量标准中的效度要求,已成为新时代教育测评亟待解决的课题。其次,自2020年以来,许多日常教学活动与大规模测评都开始采取远程在线方式,随之而来的信息泄露与考试安全管理问题日益凸显。如何有效保障测评数据的安全性与测评过程的规范性也是必须重视的环节。最后,受地区经济发展不均衡影响,不同区域之间存在明显的“数字鸿沟”,在线学习样态与条件差异显著。学生评价需充分考虑学生、学校及地区在政府投入、社会资源与家庭支持等方面的外部环境差异,并基于此构建更具区分度、可行性与包容性的评价方案,以促进教育评价在数字技术赋能背景下的实质公平。
四、结束语
学生评价改革作为推进教育评价改革的重要一环,是推动我国基础教育高质量发展、牵引育人方式变革的关键力量。学生评价改革是一项系统性工程,涵盖结果性评价、综合素质评价与日常学习评价三大范畴,其核心目标是确保党的教育方针有效落实、满足国家科技创新与人才选拔的战略需求、倒逼育人方式革新、推进教—学—评一体化实施,从而实现从应试训练向全面育人的教育评价变革。通过协同推进考试形式与内容改革、完善综合素质评价机制、发挥作业的日常评价功能、强化信息技术赋能等路径,逐步构建起科学、完整、动态发展的学生评价体系。当前,学生评价改革仍面临诸多挑战,既需要持续深化理论研究与实践探索,也需要教育工作者、研究者、政策制定者等多方主体的共同参与、协同推进。唯有构建起科学合理的学生评价体系,并规范、创新地运用评价技术,才能充分发挥学生评价的育人功能,为教育强国建设提供有力支撑。
作者:辛涛,北京师范大学中国基础教育质量监测协同创新中心主任,教授;孙小坚,西南大学教师教育学院副教授(通信作者)。
来源:辛涛, 孙小坚, 杨丽萍. 以学生评价改革牵引育人方式变革[J]. 中国考试, 2025(12): 1-11.