当前位置:首页
> 教育专题 > 教育评价改革 > 理论之窗

教师增值评价的理念发展、模型变迁与效果评估研究
发布日期:2023-11-28 浏览次数: 字体:[ ]

教师增值评价是将教师教学对学生学业水平进步的净效应作为衡量标准的教师评价模式,即采用排除学校、家庭等非教师投入因素之后的学生成绩来比较教师教学质量的差异。20世纪60年代,随着泰勒(Terry Taylor)科学管理思想的出现,以及科尔曼(James Coleman)对教育投入关系的阐释,依托教育生产函数探究教师教学行为与学习成果之间关系的研究成为研究热点。20世纪80年代,田纳西州的桑德斯(William Sanders)团队首次使用增值评价进行实践探索,并以学生成绩的变化对教师效能进行评价、甄别。1992年,在新自由主义政策倡议的背景下,资本主义发达国家教育公平问题逐渐凸显,教师增值评价首次以立法形式出现在田纳西州教育改革法案中,成为教师问责制的一部分,该举措引起教育研究者的广泛关注。2001年,布什(George Walker Bush)总统签署不让一个孩子掉队No Child Left Behind, NCLB)教育改革方案后,基于学生考试成绩的教育问责体系在美国各州试行起来,增值评价成为其改革的重要方向之一。2009年,美国教育部出台了力争上游Race to the Top, RTTT)教改计划,该计划旨在通过制定规范的学业评价标准并建立学生学业跟踪数据库,从而为各州增值评价改革的实施提供支持。2015年,奥巴马(Barack Hussein Obama)总统签署了《让每个学生成功法案》(Every StudentSucceeds Act, ESSA),该法案不再将教育的成功标准局限于标准化考试成绩,且第一次在评价标准中加入了大学入学和职业准备college and career readiness)概念,增值评价不断向着指标多元、面向发展的方向演变。

当前,我国教育进入高质量发展阶段,如何通过教育评价反映出学生的真实进步以及教师实际的教学效能,是研究者探索的主要问题之一。2020年,中共中央、国务院颁布的《深化新时代教育评价改革总体方案》提出要探索增值评价。2022年,教育部印发新修订的义务教育各学科课程标准,要求重视学生的学习起点和学习过程,使用适切的统计分析方法计算增值,真实反映学生在学业总体成绩及核心素养上的增长点,发挥增值评价对学生发展、教师成长和学校变革的激励和助推作用,为结果评价提供重要的证据支撑,以如何实现增值为目标做好工作。可见,增值评价在政策导向和教育实践中受到越来越多的重视。

1 教师增值评价的理念演变与概念解析

1.1 教师增值评价的理念演变

教师增值评价的早期实践旨在通过更加客观的方式对教师教学效能进行评价。其客观性体现在两个方面:一是对非教师因素进行充分考虑,教师增值评价旨在剥离学生背景、学校背景差异后,将学生成绩变化与教师效能评价进行关联计算;二是基于量化数据进行评价,教师增值评价使用基于纵向数据的增值模型进行标准化计算,克服以往管理者对教师进行主观判断所带来的低信度问题。随着教育生产函数与增值评价研究的深入,有研究者指出,教师增值评价是否更客观、公正、合理,在很大程度上取决于评价指标能否准确识别教师对学生学习的贡献,进而为教师教学效能评价提供可靠的衡量标准。

在美国的教师评价改革中,许多学区选择通过体现教学质量的增值评价来加强对教师的管理与问责,并将学生学业进步与教师职业发展相关联。随着各学区数据库的日益健全,教师增值评价越来越依赖于各种教与学证据的收集,根据管理者为教学场景预设的投入、产出指标,将学生学业发展作为测量教师效能的重点,对教师绩效进行测量、计算、评价,展现出服务于管理目标的绩效主义倾向。该理念下的增值评价在实施后引起许多争议:一是基于基础知识的标准化测验,会使学生多元发展受到局限并导致课堂窄化现象;二是基于学生成绩的绩效测评,会降低教师能动性并导致应试教育。在新自由主义经济背景下,西方社会贫富差距加大,教育公平问题凸显。若从保障教育结果公平的角度进行干预,会导致教育向着功利主义描绘的绝对均等状态发展。教师增值评价从教育机会公平入手,在剥离学生家庭社会经济地位等个人背景因素的同时,以学生学业发展和变化对教师进行测评,旨在避免学校、教师对生源的过度选择,实现教育资源的合理配置。正如布鲁姆(Benjamin Bloom)所言,为每个学生都能取得在自身能力基础上的最大进步创造条件。该理念下的增值评价既保护了各阶层人群从事生产劳动和创造财富的积极性,同时又促进了不同背景儿童受教育机会的相对公平。

以往的教师增值评价过度强调程序一致性、计量精确性和指向明确性,如杜威(John Dewey)所说,这将会使教师热衷于采取高效、迅速而非有利于学生及自身发展的方式来取得更优的评价结果,从而导致评价理念与实践效果之间的割裂。教师增值评价的最终目的是要让师生在行为、情感互动中,产生知识能力变化及相应的心理发展,并对其生活产生积极的影响:一是服务于教师发展,旨在引导教育者关注每个学生的发展,实现立德树人的同时,注重自身持续、全面、终身的个人发展;二是服务于学生发展,旨在对其各阶段的学习发展进行多维过程性与终结性评价,兼顾其综合素质发展与个性化发展,为学生终身发展奠定基础。

1.2 教师增值评价的概念解析

教师增值评价中的增值(value added)一词,广义上是指物体整体价值的增加。因此,抓住了价值的内核,就能在质的基础上对增值进行量的评价和比较。对于价值(value)的讨论最早起源于亚里士多德(Aristotle),他认为,价值就是一切物体共同具有的本质。

从劳动价值论进行分析,配第(William Petty)最早指出产出的价值由投入的劳动时间所决定。在教育领域,教育投入指学生在整个学习过程中的各项投入,既包括以教师影响、课堂冲击、校园文化氛围为代表的学校投入,又包括以学生本人条件、家庭社会经济地位、区域文化资本、同伴效应为代表的校外投入。教育产出包括学生以知识技能、创造能力、社会态度为代表的认知及非认知能力的人力资本提升,及其因教育所带来的市场回报、经济增长等经济产出。综上,教师增值评价即对教师行为带来教育产出增值的效能进行评价的一种方式。

教师增值评价概念的产生及发展涉及社会学、经济学、统计学、管理学等多个领域,为准确把握教师增值评价的概念,本文从多视角梳理其理论基础和概念界定。从效能评价视角看,教师增值评价将教师对学生成长的促进作用作为教师效能的衡量标准,以起点到终点的变化值对全体或部分教师的有效投入进行评价;从绩效管理视角看,教师增值评价依据管理和发展的需要,将学生成长变化是否达到阈值与教师评级相关联,并作为教师绩效评估基础的评价规则,以本位价值思想和机会公平理论重构教师负责任制;从生产函数视角看,教师增值评价在控制学生、课堂、学校等非教师因素对教育产出的影响的条件下,将教师投入对教育产出的影响进行单独考虑,以得到相对公正的教师净影响数值;从证据采集视角看,教师增值评价基于成长评估理念,收集学生在不同时间点知识、技能、能力水平的证据,以其在多次测量中的成长纵向数据作为教师评价依据;从统计测量视角看,教师增值评价在科学管理思想的引领下,基于学生成长变化的有效度量,借助以多水平模型为代表的统计计量模型计算成长增量,或实际成绩与预测成绩之间的差异;从教学目标视角看,教师增值评价采用标准化测验成绩来表征学生对既定学习目标的达成度后,以大学参与理论和输入-环境-输出模型为依托,用学生成绩在一段时间的变化来表征教师工作对教学目标的贡献度。

总体来看,教师增值评价本质上是在分离出非教师因素对教育产出的影响之后,将教师因素对教育产出的影响进行单独量化,得到代表教师实际效能的标准分数。其概念主要由3个部分组成:一是要素选取,即依据教育生产函数的研究结果,对教育投入、产出进行分类选取。其中,教育产出强调以成绩为重点的学生学业产出,弱化了学生在思维、态度等非认知能力上的收益及教师在自身学术、教学能力上的提升;二是数据量化,即依据一定的标准和规则对各要素信息进行量化,并将学生成绩按照后测成绩减前测成绩或实际成绩减预测成绩的规则进行计算,得到学生增值评价分数。三是成绩关联,即根据一系列统计分析和数学建模,将剥离非教师因素的学生增值评价分数与教师对教育产出的贡献度进行关联,再将教师效能与教师评价结果进行关联,得到教师增值评价分数。

在教师增值评价的研究中存在两种倾向:一是基于商谈和理解的人文价值倾向,二是基于制度和规范的工具价值倾向。在人文价值指导下,应基于师生个体的发展诉求,通过对师生身心素养发展的量化,引导教师以职业发展和身份认同为目标进行教学投入。在工具价值指导下,应基于学校地区的管理要求,通过对教育目标达成程度的量化,激励教师以绩效排名和为目标进行教学投入。在此基础上,笔者认为教师增值评价应兼顾人文诉求与工具理性,以工具理性为起点和基础,以人文诉求为目的和使命,寻求教师管理与师生发展之间的平衡点。

2 教师增值评价的模型解析与方法

2.1 教师增值评价的模型解析

在功能和构成分析前,首先要明晰增值模型(value-added models, VAM)的概念定义,以便为后续的理论探讨建立更明确的范围。增值模型的定义相对统一,即包含多种统计方法的数学建模,但其复杂性仍导致持不同研究偏好和学术背景的人存在不同观点。例如,教育学背景的研究者倾向以教师效应进行定义,统计学背景的研究者倾向以数据计算进行定义,经济学背景的研究者倾向以投入要素进行定义。综合来看,在教师增值评价应用中使用的增值模型,本质上是使用一组计算方法和规则来控制协变量影响,以确定教师对学生成绩纵向变化净影响的统计模型。

增值评价对教师效能进行准确、有效、可靠衡量的目标,决定了每种模型都须包含3类功能:一是数据转换功能,实现对学生、课堂、学校的嵌套数据进行正确关联及关系参数化,将零散的数据重组为高质量、可用性强的评价证据。转换中可能存在的问题包括,用于模型估计的数据量不足、信息缺失以及信息间关联方式的模糊。二是函数分析功能,为变量之间的因果效应建立教育学、统计学均可解释的关联规则,并以函数组形式展现。分析中可能出现的问题包括,部分变量可能随时间增强、减弱的延迟效应,以及难采集、未采集变量带来的非均匀随机效应。三是效能输出功能,目标是在一般环境中能稳定输出残差值,输出具有低均方误差(mean squared error, MSE)的结果。数据转换层、函数分析层的待解决问题,导致效能输出层从理论转向实证面临巨大的挑战。

增值模型作为一种数学模型,是由诸多变量和分析方法构成的。在模型变量方面,增值模型通常以学生前测成绩作为自变量,以后测成绩作为因变量,以可收集、测量、量化的非教师影响因素作为协变量,以未考虑因素作为随机变量。在模型方法方面,增值模型主要依托线性回归和方差分析,从固定效应分析到混合效应分析,实现交叉效应、嵌套数据的分析。随着统计分析软件的开发和数据分析技术持续进步,增值评价模型研究中逐渐出现传统分析方法与智能算法结合的理论设计与准实验分析。

2.2 增值评价模型的变量构成

学生的个人发展是教育质量的核心,即整个学习过程中学生在认知、技能、态度等方面的收益是衡量教育质量的核心标准。因此,增值评价模型多以学生个人发展起点的量化数值作为自变量。在教师增值评价中,该数值的测量方式须根据教学目标及学科特征设定,测量内容须能代表与教师影响有因果关系的学生能力水平,因此,模型的自变量通常被简化为学生的学业成绩测评的数值。因为学生学业能力的发展大多是受该科目教师影响,而学生高阶思维能力、社会交往能力的变化会受到多个教师的交叉影响,所以,很难将学生的全面成长与单个教师建立因果关系。对于多次纵向比较的测评有两个难点:一是测试问题的选取,即测试是否衡量最重要或有价值的技能;二是测试量表的等值,大多数测试的开发人员使用项目反应理论来构建评分测试。随着增值评价理念的成熟以及模型技术的发展,在课堂观察量表、成长档案袋等工具的辅助下,自变量从最初仅能代表数学、科学、语言等测试型科目的学业成绩,到现在也可以代表音乐、美术、表演等表现型科目的学业成绩。例如,在学生成长档案袋评价中,由教师首先选择评估标准,接着收集学生不同时间段的成长证据进行打分,最后将结果用来计算教师个人增值得分。

教师增值评价模型主要使用协变量表示学生及其家庭层面、课堂班级层面的特征。学生及其家庭层面的特征通常用免费或降价午餐状态、英语学习者状态和特殊教育状态来表征。部分研究也会使用税务记录数据,对学生居住环境、家庭收入、父母特征等信息进行直接获取,以反映学生家庭成员的社会经济地位。一些研究表明,这些特征不仅影响学习起点,而且影响学生的学习速度,田纳西增值评价系统(Tennessee value-added assessment systemTVAAS)所使用的模型就因未能充分控制社会经济地位和人口因素而受到批评。课堂层面的特征主要包括所教授班级上一年考试的标准差以及上一年教师的持续性影响。使用教师增值评价对教师进行跨校比较、排名时,还需使用协变量表示学校层面的特征。学校层面的特征除了学生人口信息的整体情况外,还包括学校对每个学生的平均财力、物力支出以及学校地理位置信息。此外,部分研究者还会在模型中额外增加教师层面的协变量,包括教师在该学区的教龄、经验情况,用于平衡新老教师间的原始差异,使评价体系对新入职教师更加友好。

随机变量由无法提前预知的突发事件和无法实现计算的协变量两部分组成。前者包括课堂突发事件、社会突发事件等,后者包括测试题目与课程目标的匹配度波动、纵向测评尺度的均衡性波动、师生随机匹配及相互影响程度波动。由于大多数增值评价模型只将非教师因素纳入计算,影响学生成就的未测量变量就成为所谓教师效应的一部分。因此,这些随机变量也是导致模型误差的原因。当随机变量越接近正态分布、越具有方差齐性时,给测评带来的误差也就越小。

2.3 增值评价模型的方法演变

早期线性回归方法主要包含两类。一类是简单差值法,这类方法需要假设每个学生的成绩增长目标相同,且学生成绩变化只受教师因素的影响。首先使用后测值-前测值来计算学生在特定时间段内的成绩差值,再将单个教师所负责的全部学生的成绩增长平均值与固定标准相比较,以评价该教师教学质量的高低。另一类是预测差值法,该类方法综合考虑了以人口学特征、家庭社会经济地位为代表的学生层面因素对成绩的影响,采取多元线性回归的方法用作教师增值分析。首先基于学生前测成绩及学生个人特征计算出预期成绩,再使用实际值-预测值来表示教师在特定时间段内对学生成绩的附加值,也就是用回归分析中残差值的大小来表示教师教学质量的高低。该方法需要假设变量具有独立性,误差呈正态分布及方差齐性。

随着教师增值评价考虑的变量越来越复杂,以多层线性模型(hierarchical linear modelingHLM)为代表的增值模型被用来处理多维嵌套数据,以期对教师效能做出更准确的估计。增值评价模型在基于自变量、协变量对因变量进行线性回归分析的基础上,依托方差分析对学生层面的组内协变量进行建模,依托协方差分析(analysis of covariance, ANCOVA)对学校层面的组间协变量进行建模,依托随机效应或集群调整来解决学生在教室或学校校内的分层嵌套结构问题。该方法需要假设各协变量与因变量呈线性关系、各协变量与自变量之间不存在交叉影响。使用该类方法进行教师增值评价的理想环境需满足3个条件:一是实际成绩分布的正态化,每个学生都能在等间隔的线性尺度上找到其能力素养的对应分数,且规律分布;二是班内方差的同质性,在进行组间比较时,各组内学生的能力基础和发展潜力没有显著差异;三是教师影响的独立性,除了模型中设定好的干扰因素外,教师是学生学业增值的唯一贡献者。这些条件很难成立,模型误差不稳定的现实问题仍有待解决。此外,在此类模型中,一些未涉及的变量对结果造成的影响,也会被归到教师效应的一部分,导致结果不稳定。若使用含有不同误差的模型进行测评,会导致结果具有差异性,难以进行比较。

随着计算机技术的普及和智能算法的成熟,部分研究者开始探索使用机器学习中用于增值评价回归分析和结果分类,利用监督学习进行模型训练,使变量关系与现实情境更加匹配。例如,洛克伍德(J. R. Lockwood)等开发了持久性模型的贝叶斯版本,用于应对交叉效应和随机效应带来的计算挑战,增强支持多主体变量的持久性模型的高效性和扩展性,并借助WinBUGS软件实现该模型,后又结合马尔科夫链蒙特卡罗采样算法(Markov Chain Monte Carlo, MCMC)对预测分数分布进行采样。通过构造符合一定规则的随机数来解决增值评价模型输入和输出之间的关系问题,将大量前后测分数与协变量数据作为训练集对模型进行监督学习,再根据学生的前测分数和真实的协变量信息,通过不断的采样(Monte Carlo)和状态转移(Markov Chain)得到预测分数的分布,即根据输入的教育投入数据对教育产出进行估计。该研究团队主要解决了测试分数缺失、协变量分布不均等问题。李俊飞等对神经网络在增值评价中的应用进行了理论分析,将自变量和协变量数据作为输入节点,将教师增值分数作为输出节点,利用神经网络的可反向推导得到各层的误差值。此举有助于在违背独立性、正态性、方差齐性假设的现实情境中,基于权重值解释教师影响的净效应,避免参数估计不足的问题。

3 教师增值评价的实践效果评估

3.1 教师增值评价的实践模式

3.1.1 基于学业成绩的教师个人增值评价模式

教师增值评价在实际应用中通常是以提升学生成绩作为主要目标。田纳西增值评价模式便是其早期实践的代表,该模式在建立之初把学生阶段成绩的变化值纳入考试型科目的教师考核,随后迭代出基于学生过程评分和学业成就的评价模式,即学生成长档案袋评价模式和田纳西教育者促进模式。这两种模式评价覆盖的教师类型更广,评价维度更优;但它们都是围绕学生学业情况的评价,而非基于学生终身发展的评价模式。同时期的达拉斯增值评价系统,使用增值标准来评定高效教师及缺乏胜任力的教师,该系统与田纳西增值评价系统相比较有4个不同:一是它在评价前根据学生所处水平的特征以及该学生的分数对其重新赋分;二是它所使用的模型仅对相邻年级调整过的分数进行分析,而不是结合所有年级的分数;三是该模型不对测试分数及增值变化进行建模,而是展现它们之间普适性的结构关系;四是该模型不仅包括教师对学生成绩的贡献,还利用其他因素计算学校对学生成绩的影响。

3.1.2 基于学生素养的教师集体增值评价模式

随着增值评价应用的年级从基础教育的中间段向两端延伸,教育增值评价指标除了专业知识技能外,还涉及学生高阶思维水平、社会情感技能等教育衍生能力的发展变化,特别是在高等教育阶段。例如,智者平衡评估联盟测试系统(the smarter balanced assessment consortiumSBAC)由计算机生成适应性测试和任务,为教师提供详细的教学信息,以帮助学生应对大学学业和职业准备的挑战;大学学习和就业准备联合测试(partnership for the assessment of readiness for college and careerPARCC)由诊断性测试、绩效任务、口语和听力评估组成,在学期全过程对学生进行追踪,包括基本知识和复杂信息处理能力;大学生学习评价(the collegiate learning assessmentCLA)由表现性任务(performance task)与精选型题型(selected-response question)构成,更关注本科生的高阶思维对发展水平,强调衡量学生在校期间高阶思维的增值情况。值得说明的是,对于此类能力的评估,多用于教师集体的增值评价,而非针对个人。

3.1.3 基于终身发展的全体师生增值评价模式

教师增值评价体系始于单一使用以学生为主体的教师增值评价,向与多主体相结合、多种评价方式互补的评价体系发展。通过与教师个人评价、教师同行评议、课堂教学评估、专业技能测评等评价方式的组合,弥补以往教师增值评价中对教师主体缺乏关注的问题,有助于平衡学生的能力提升、个人发展和教师的学术能力、教学能力和教学产出。例如,俄亥俄州的教师评估体系,主要以学生成长增值的滚动平均值和教师表现的量表分数来评估教师,此外还可以加入学生调查、教师自我评价、同行评价、学生档案袋评价等评价方式以适应不同类型教师考核的需要。哥伦比亚学区针对知识型学科教师的评估体系,将增值评价与学校和教师的主观评价以及对教师出勤情况、教学计划、教学过程、教学效能、合作关系等的全面评价相结合。

3.2 教师增值评价的效果评估

3.2.1 感知分析:剖析教师主观感受及原因

感知分析主要是对参与教师的主观意见进行记录和转录,通常基于问卷调查或多次半结构化的深度访谈。其目的是了解教师对增值评价过程和结果的体验和理解以及教师对自身参与教学实践的主观感受。例如,Collins在研究中邀请教师围绕以下4类问题进行主观判断:一是,增值评价系统是否有助于改进教学;二是,是否增加了学生的学习机会;三是,是否有助于识别教师效能;四是,是否有助于改善教学环境和条件。感知分析作为量化分析、客观分析或外部分析的补充,体现出对评价主体的人文关怀。从访谈结果中可以发现,学生特征差异、学生样本数量、测试内容低一致性等教师不可控因素导致的增值评价分数不稳定,将进一步导致教师职业认同感下降、动机不足。因此,部分研究人员认为,增值评价模型对教师效能的评估往往不够精确,无法支持一些理想化的推断,且目前的研究基础不足以支持使用增值评价机制对个别教师做出人事决策。

3.2.2 过程分析:检验教师成长及教学改善

过程分析主要探究教师增值评价是否提供有价值的信息,以提升教师的工作效率并促进教师专业发展。采用的方法主要包括课堂观察和资料支持。课堂观察的基本过程是对课堂教学活动和互动情况进行真实、详细的记录,再对观察者的现场感受、反应和印象进行记录,最终得到结构化的课堂数据。其目的是深入了解教师教学实践中的教学重点、话语特征、反馈质量等,并理解教师主观感受与课堂教学的一致性。例如,Pianta等开发的课堂评估评分系统(classroom assessment scoring system, CLASS)可以用来对教学方法、师生互动以及课堂环境等关键教学维度进行结构化评估,具体包括教师对学生知识理解和思想提升上的帮助程度及反馈质量等。资料是在不干扰教学活动的前提下收集未经过参与者人为筛选的教师日志、观察记录、学生作业等,其目的是对教学现象分析进行补充。现实中由于增值评价的结果数据未能与教学过程信息形成联系,教学人员难以从增值评价的数据中获得改进教学的具体信息,导致教师对增值评价的认同感不强,甚至在分数考核的压力下,教师们做出在考试中默许学生作弊,形成不利于教师间合作的竞争关系等与增值理念相违背的行为。

3.2.3 结果分析:检验评价有效性和发展性

结果分析主要检验两个问题:一是增值评价结果是否有效反映教学质量,二是增值评价导向是否有利于学生的长远发展。在探究增值评价结果是否有效反映教学质量时,主要采用专业测试、专家评分、课堂观察等对教师教学质量、专业能力进行估计,并将结果与增值评价结果进行相关性分析。例如,Hill等在研究中首先采用数学教学质量观察工具(mathematical quality of instruction, MQI)对教学进行编码,再由两名评分员分别对课堂教学质量进行单独评分。在探究教师增值评价是否促进学生长远发展时,主要采用数据库追踪取证的方法直接获取学生在大学或成年后的真实表现信息。例如,Chetty等依据美国联邦所得税申报表中关于学生高等教育质量及出勤率、工资收入、社区质量、青少年时期的生育率等信息,得出假如用普通教师替换增值评价中得分最低的5%教师,将使每间教室中学生终生收入的现值增加约25万美元的结论。有研究指出,在衡量教师教学质量有效性的众多指标中,增值评价分数和校长评估分数被认为是主要指标,但这两种评估方式的分数通常不匹配。校长评估分数通常比增值评价分数更高,且结果稳定性更强。从这一角度来看,主观评价方式可能会高估教师的教学质量,且评分缺乏区分性。

4 教师增值评价的未来趋向

结合以上分析,笔者从模式驱动、指标融合、数据互联、模型优化、平台贯通5个方面探讨教师增值评价的未来发展趋向。

第一,建设教学效能增值的多元评价体系。当前,教师增值评价因受到技术、方法的限制,仍存在稳定性不足的问题,不能为教育全局发展和个体发展提供精准的指导。因此,需要将增值评价与其他多种评价方式相融合,形成促进师生协同发展、整体育人成效与学生个性发展兼顾的多元评价体系。在遵循教师教学发展规律,突出教师教学质量要求的基础上,设计灵活共享的评价思路、规范有序的评价流程、稳定适配的评价环境作为评价体系的支撑,以促进教师教学效能提升,辅助教师专业发展。在不断迭代中,逐渐形成教学过程与结果并重、教育制度与学校文化并存的教师评价模式。

第二,探索立德树人导向的增值评价指标。教师增值评价研究的先发国家多为西方资本主义国家,其教育评价标准是基于资本主义社会变化的情境所发展出来的。对于中国而言,需立足于本国的现实情境,对西方增值评价理念进行调整、重塑和内化,根据本国教育理念和文化需求,构建以立德树人为导向、以教师专业发展和学生综合素质发展为目标的纵向分析指标。同时,在保障科学有效揭示评价主体认知及非认知状态变化的基础上,根据教育管理目标、教育执行情况、技术驱动水平等选择更高效、便于操作的方案。

第三,形成多源增值证据的数据链接网络。海量真实数据对增值评价模型训练和实际测评都具有重大意义。在增值评价初始阶段,需要在确定关键性或全面性指标后,采用高效度、低难度、低成本的主观评价与标准化测试相结合的方式,清晰地记录、收集能够表征相应指标的跨时空数据、多模态数据,并科学、准确、简便地对多源数据进行纵向等值处理和转换;之后是使用分布式数据库对各学校、地区的增值评价数据进行收集、整合、存储,实现数据管理一体化。最后以贴标签的方式对数据进行编码,实现跟踪数据与评价证据链稳定转化、协同、链接,为后续分析和管理奠定基础。

第四,构建整合自适应等技术的增值分析模型。教师增值评价的实施情境是多样态、非线性、动态性的,教师效应与学生成长间的关系往往受环境、条件、过程的复杂影响,很难用简单的线性因果关系来解释。因此,在进行因果推理时,可结合人工神经网络对已有数据进行训练,对增值评价模型算法路径和架构设计的有效性、适应性方面做更深入的论证、设计和迭代,以期在准确衡量教师绩效的同时,支持教师持续增值。之后,再将初步构建的智能模型运用到不同教学情境中,通过与真实场景的不断互动、磨合和调节,来提高评价技术的通用性和操作性,以期模型能够在不同学科、年级、场景中推广和应用。

第五,设计贯穿整个流程的增值评价平台。增值评价平台需要完成不同对象、科目、场景等有针对性的评价任务,复杂性较高。而现有的教学评价平台灵活性较弱,较难适应开放教育环境下的各类评价需求。而且,平台有时出现数据更新不同步、资源关联性差、信息发布分散等问题,难以实现对教师个体、集体增值评价的证据整合。为实现增值评价数据整合过程的透明处理,需要确保教师端、学生端、管理端的相互衔接和协调。通过制定和完善教学管理平台的开放制度和统一标准,为相关人员展开培训,实现教学质量检测、数据共享管理、增值模型分析等功能的稳定运行,打破增值评价流程中的屏障。

5 结束语

随着教育评价改革不断深入,教师增值评价为教学评价提供了新的方向和技术手段。这种基于投入产出比的大规模量化评价也逐步走入我国研究者的视野,成为教学评价的热点。在此背景下,本研究基于国内外以教师增值评价为主题的研究成果进行系统梳理和总结,展现当前教师增值评价的理念发展、模型变迁及效果评估等研究进展,为接下来的理论融合与实践创新奠定基础。最后研究提出在多元评估模式、本土指标构建、测评数据互联、分析模型整合、智能平台设计等方面的本土化探索方向,以期通过教师教学效能的有效测评,促进教育评价高质量发展,助力推进我国教育评价现代化。

 

作者:牟智佳,江南大学“互联网+教育”研究基地副教授;李燕飞,江南大学教务处(教师发展中心)助理研究员。

原文刊载于《中国考试》2023年第9期第10—20页

 


分享到:
【打印本页】【关闭本页】