杨志明 陈一龙:教育评价学研究生课程的特点及其建设

发布时间:2026-02-26     浏览次数:

摘 要:教育评价学首次被设立为二级学科,既是深化新时代教育评价改革的一大举措,也是培养高层次教育评价学专业人才的有力手段。目前,国内仅有少数高校的个别学科招收教育评价方面的研究生,相关的课程基础还十分薄弱。借鉴国外高校相关专业的研究生课程设置方案,针对我国“五唯”问题突出的实际情况,建议设置基础性、应用性和综合性三类研究生培养课程,确保高层次教育评价学人才具有坚实的理论功底和技术方法,为构建中国特色的教育评价体系、推进教育强国建设发挥应有作用。

关键词:教育评价;教育测量;应用统计;研究生教育;课程设置

2020年6月30日,中央全面深化改革委员会第十四次会议审议通过《深化新时代教育评价改革总体方案》,要求落实立德树人根本任务,着力破除唯分数、唯升学、唯文凭、唯论文、唯帽子的顽瘴痼疾,建立科学的、符合时代要求的教育评价制度和机制[1]。文件发布以来,教育评价专业建设越来越受到重视,高层次专业人才的需求量也逐渐增大。2024年1月,《研究生教育学科专业简介及其学位基本要求(试行版)》(以下简称《专业简介》)发布,首次将教育评价学列为教育学一级学科门类下的15个二级学科之一[2]。然而,我国在教育评价学研究生教育的课程建设基础十分薄弱,目前仅有少数几所师范院校设置了少量与教育评价相关的研究生培养项目,且专业名称比较随意,如“心理统计与测量学”[3]和“学前教育质量评价”[4]等,绝大多数高校教育学部(院、系)尚未设立教育评价学相关方向的研究生培养项目。由此可见,教育评价学研究生教育的课程建设亟待加强。

一、教育评价学的学科特征

根据《专业简介》,教育评价学是一门研究教育测量与评价的理论、方法、技术、工具,为教育督导、监测、诊断、决策、改进提供科学指导的基础性、应用性和综合性学科[2]。基础性、应用性和综合性是教育评价学的三个基本特征。

所谓基础性,指的是教育评价学需要有自己的理论和方法体系,需要发展教育评价的范式、功能和原理。例如,教育评价实践中的目标导向模式、目标游离模式、CIPP模式等,需要全面梳理,并结合唯分数问题突出等实际情况,建立一套能够支持教育强国战略的教育评价学科话语体系。又如,从学生发展评价角度看,教育评价需要构建一个包括标准设定、事实认定、价值判断和教学改进的闭环[5-6]。标准设定需要涵盖立德树人的要求,要关注学生德智体美劳的全面发展需求,并把这些需求与学生的核心素养、课程标准和教学内容结合起来,贯穿在课前、课中和课后的教与学的过程之中;事实认定包括教师对学生的课堂观察、作业批改、考试分析等工作,目的是诊断学情,发现学生的长处和短处,对学生在知识掌握、能力发展、素养形成等方面的状况做出精准测量;价值判断指的是依据预先设定的标准、相关的政策及教与学的理论,对学生的发展水平、进度、质量和效益等做出价值层面的评判,给出诸如“合格”“良好”“优秀”等的结论;教学改进指的是教育评价的目的需要服务于教与学,需要根据事实和主观评判,针对学生的基础和潜力,制订或调整教育教学计划,改进教与学的工作。类似地,这个闭环也可以用于教师评价、管理评价等其他方面。

所谓应用性,指的是教育评价学的原理能够指导教育教学实践,其方法与技术能够用来解决我国在教育督导、教育质量监测、教育考试和教学评价中的实际问题。在标准设定方面,需要懂得如何根据课程标准和教学内容设计教学评价指标体系,需要掌握头脑风暴等创新思维和系统思维的操作方法。在确定教学评价指标的权重方面,要懂得德尔菲方法、模糊数学指标权重设置方法等;否则,预设的教育评价标准就可能偏离教育目的,各评价指标的权重设置也可能使整个评价工作偏离正确方向。在事实认定方面,需要教育统计与测量的理论、模型与工具,包括经典测验理论、项目反应理论和概化理论的原理与方法,调查问卷的设计与实施方法,以及大数据挖掘的理论与技术等[2];否则,事实认定的测量误差可能很大。在价值判断方面,需要具备领会或把握党的教育方针、相关政策、课程标准及教学内容等方面的本领,需要了解高考和中考改革方面的政策措施等;否则,价值判断很可能带有较大偏见。在教学改进方面,需要懂得教育教学的一般理论与方法以及学科教学的原理与方法,还要懂得学生的认知和情感发展规律;否则,很可能给出不恰当的甚至是违背教育规律的教学改革建议。

所谓综合性,指的是教育评价工作包含理念与方法、结果与过程、投入与产出、教师与学生、学校与家庭、教学与管理、单项评估与综合评估等多个方面、环节和手段。从学科基础方面看,教育评价要以马克思主义为指导,综合使用测量学、统计学、信息科学、管理学、心理学、伦理学等学科的理论与方法[2]。从方法论角度看,教育评价既包括量化研究,也包括质性研究;既要有理论高度,又要有实操技术;既要有典型案例,又要有普遍规律。因此,教育评价学是一个综合性的课程群,而不是特指某一门课程。

二、国外教育评价学研究生课程的设置情况

发达国家的相关课程建设经验可以为我们提供一些参照与参考。在美国,许多高校都设置了与教育评价学相关的博士研究生培养项目,如爱荷华大学(University of Iowa)的高级测量评价中心(Center for Advanced Studies in Measurement and Assessment)、马里兰大学(University of Maryland)的统计与测量量化研究中心(Quantitative Methodology:Measurement and Statistics)、加州大学洛杉矶分校(University of California, Los Angeles)的教育测评中心(Center for Educational Assessment)、北卡罗来纳大学教堂山分校(Univer‐sity of North Carolina at Chapel Hill)的高教研究与评价中心(Office of Institutional Research and Assessment)、马萨诸塞大学安姆斯特分校(University of Massachusetts Amherst)的教育测评中心(Center for Educational Assessment)等,均开设了与教育评价相关的博士研究生培养项目。这些项目的课程主要涵盖应用统计学、教育测量学和教育心理学三个领域。

以爱荷华大学高级测量评价中心的博士研究生培养项目为例,其应用统计学模块包括7门必修课程,即中级统计方法(Intermediate Statistical Methods)、相关与回归(Correlation and Regression)、实验设计(Design of Experiments)、非参数统计方法(Nonparametric Statistical Methods)、因素分析和结构方程模型(Structural Equation Modeling)、多元统计方法导论(Introduction to Multivariate Statistical Methods)和教育统计与测量研究专题(Topics in Educational Measurement and Statistics);其教育测量学模块包括8门必修课程,即评价工具的研发与应用(Construction and Use of Evaluation Instruments)、教育测量与评价(Educational Measurement and Evaluation)、教育测量理论与技术(Theory and Technique in Educational Measurement)、量表标定方法(Scaling Methods)、项目反应理论(Item Response Theory, IRT)、教育测量与评价专题研讨(Seminar in Educational Measurement and Evaluation)、测验等值与标定(Equating and Scaling of Educational Tests)和概化理论(Generalizability Theory);其教育心理学课程模块包括4门选修课程,即教育心理学(Educational Psychology)、量化教育研究法(Quantitative Educational Research Methodologies)、项目评估(Program Evaluation)和教育心理学专题研讨(Seminar in Educational Psychology)。当然,不同高校的课程设置并不完全统一,有些课程的内容也因教授学术专长的不同而有差别。

三、对我国教育评价学研究生课程设置的建议

根据教育评价学的基础性、应用性和综合性定位,参考美国部分高校的教育测量与评价博士生培养计划,结合中国的实践需要,从构建我国教育评价学专业体系的角度出发,建议设置以下教育评价学博士研究生课程。

首先,基础性课程。这类课程包括教育与心理统计学、教育与心理测量学、教育评价原理与方法、项目反应理论、概化理论、认知诊断模型、课程与教学论、教育心理学、相关与回归、实验设计、非参数统计、结构方程模型、多层线性回归、多元统计方法等。总体来看,这类课程的基础较好,内容比较成熟。

其次,应用性课程。这类课程包括量表标定、常模研发、标准设定、测验等值、统计软件应用(SPSS、SAS、R等)、IRT软件应用(WINSTEPS、PARSCALE、IRTPRO and flexMIRT等)、Python语言、人工智能基础等。开设这些课程时,一方面要吸纳国际考试与评价领域的成功实践经验,另一方面要吸收人工智能技术发展的最新成果,以满足我国教育评价改革与发展的现实需求。

最后,综合性课程。这类课程主要包括教育测量新发展、教育评价理论探究、AI与教育评价、结果评价研讨、过程评价研讨、增值评价研讨、综合评价研讨、中高考改革研讨、教育政策与督导研讨、教育质量监测研讨、作业设计研讨等专题。每个专题包含理论研讨与实践操作两部分,教学方式主要以学术讨论班(seminar)和课题研究为主。这些课程重在解决当今教育评价领域的突出问题,为破除“五唯”、改进结果评价、强化过程评价、开展增值评价和健全综合评价提供理论和技术支撑。当然,综合性课程的开设,也可根据各高校自身的师资条件作出适当调整,不必强求一致。

提升教育评价学的学科地位是深化教育评价改革的具体体现,也是培养高层次教育评价学人才的需要。基于教育评价学的基础性、应用性和综合性定位,参考国外相关专业博士研究生培养项目的课程方案,应以课程设置为抓手,科学设计教育评价学博士研究生培养方案,努力构建旨在破除“五唯”、服务我国教育实践需求的教育评价学科体系。

参考文献(略)

作者:杨志明,湖南师范大学测评研究中心主任,外国语学院教授

来源:杨志明, 陈一龙. 教育评价学研究生课程的特点及其建设[J]. 中国考试, 2024(5): 16-19.