当前位置:首页
> 教育专题 > 教育评价改革 > 理论之窗

教育评价数字化转型的内生动力与核心议题
发布日期:2024-03-06 浏览次数: 字体:[ ]

以大数据、人工智能、区块链、物联网等为代表的新一代数字技术“正以新理念、新业态、新模式全面融入人类经济、政治、文化、社会、生态文明建设各领域和全过程”,推动人类迈向数字文明。数字化转型是世界范围内教育转型的重要载体和方向,也是我国开辟教育发展新赛道和塑造教育发展新优势的重要突破口。借助数字技术与智能技术优势,深化新时代教育评价改革,推进教育评价数字化转型,发挥好教育评价改革在教育领域综合改革中的重要牵引作用,是加快建设高质量教育体系、实现教育强国目标的重要保障。

一、教育评价数字化转型的内生动力

人工智能、先进计算、数字孪生、区块链以及元宇宙等技术进步正在塑造未来社会新形态,给教育和学习的实践活动带来革命性、结构性的变革;教育评价主动回应、积极借力数智技术发展优势,是实现教育评价深层次变革的内在诉求。

(一)教育评价须主动回应技术变革与教育数字化转型

技术变革历来是推动教育评价变革的重要力量,深化新时代教育评价改革需要数智技术赋能。教育评价起源于中国古代的教育考试制度,孕育于西方的教育测量批判思潮,形成于美国20世纪30年代的“八年研究”改革运动。在评价方式上,教育评价经历了从口头表达、实际操作到纸笔作答,再到数字化评价两次大变革。第一次变革建立在造纸和印刷技术成熟的基础上,第二次变革以计算机与网络技术的发展为契机,变革速度与程度更加空前。数字化教育评价的发展依次划分为四代,即计算机化测验、计算机自适应测试、持续性测试、智能化测量。第一代计算机技术以“硬性植入”形式推动了教育评价方式变革,实现了网上考试、网上阅卷、网上录取等,优化了教育评价管理方式,提升了评价的客观公正性与效率;第二代计算机技术通过与传统测评理论相融合提升了教育评价的效度,实现了大规模测试中的差别化测评,提升了对个体测评的精度、效率及整体测试的安全性;第三代和第四代数字技术伴随着人工智能技术的产生与发展,与测评理论互为创新动力,理论上可实现对评价信息的追踪式、伴随式捕捉以及自动化评分与反馈。当前正处于从前两代跨越到后两代的过渡期。这种跨越使教育评价真正走向日常化、全面化、智能化,将为深化新时代教育评价改革,建成中国特色、世界水平教育评价体系提供重要支撑。

(二)数智技术正在成为教育评价变革的内生动力

从教育评价的内容、理念、结果效度、管理方式等维度来看,数智技术正在成为教育评价变革的基本技术物质基础。

首先,数智技术推动了21世纪核心素养测评的落地。20世纪90年代末,面向21世纪的人才培养问题,“核心素养”概念应运而生,成为全球教育改革研究的焦点议题。世界各国和地区以及国际组织争相提出的21世纪核心素养框架,大多强调沟通交流、团队合作、信息技术素养、语言、自主发展、数学素养、问题解决与实践探索能力。这些核心素养既包含学生的跨学科综合能力,也包含非学业部分的综合素养,宏观性、抽象性、整合性强,可描述性和可测量性较低,对传统教育测量与评价技术提出了巨大挑战。如今,随着数字技术、智能技术的发展以及与教育评价的进一步融合,针对一些非认知类的、综合型、表现型核心素养的测评已取得初步进 展 。 比如 ,国际学生评估项目(TheProgramme for International Student Assessment,以下简称 PISA)通过人机互动系统实现了对创造性问题解决能力、合作问题解决能力、全球素养的测评;我国义务教育质量监测借助语音合成与评测、文字及图像识别与分析等大数据和机器学习技术,开发出了演唱测试系统及文本自动标注系统,能够对学生的演唱能力与写作能力进行大规模的测评。

其次,数智技术促进了教育评价理念的发展。《深化新时代教育评价改革总体方案》要求“改进结果评价,强化过程评价,探索增值评价,健全综合评价”。结果评价以结果性评价理念为主导,过程评价与增值评价以发展性评价理念为主导,综合评价以全面性评价和个性化评价理念为主导,四种评价理念及四种评价方式互为补充,共同服务于多种评价功能的实现。但受传统教育评价观念以及实践的难度与程度等因素影响,结果性评价方式与理念一直居于主导地位。随着数智技术的发展,过程评价、增值评价、综合评价的实践障碍有望逐渐被破除,发展性、全面性、个性化评价理念将进一步彰显.具体表现在以下几方面。其一,采集学习者过程性、全面性教育发展数据的能力加强。随着语音识别、文字识别、图像识别、智能传感等底层技术越来越成熟,借助智能终端、可穿戴设备等,可以实现对学习者声音、文字、形貌、生理、心理等多模态数据信息的“伴随式”、“静默式”、“全域式”采集。其二,大规模存储与传输学习者全时空、个性化发展信息的能力加强。5G通信技术、云空间、区块链等技术的发展为数据要素的高速流通和安全有序管理创造了条件。其三,深度挖掘分析学习者发展数据,建立学习者数字画像,进行精准化和个性化评价的能力日益提升。大数据、云计算、量子计算等技术的发展,极大地增强了其对全域、全时段个体发展信息进行综合分析的能力,进一步推动对学习者个体评价的立体化。

再次,数智技术提高了教育评价的精确性和科学性。一方面,教育评价的个性化程度不断加强。随着计算机自适应技术的发展,“因人施测”在不久的将来有望成为现实。2011年,大连市 3 万名五年级学生参加了基于计算机自适应技术的英语水平评估,开始了世界上最早基于计算机自适应技术的大规模诊断测试实践探索。2018年,PISA在阅读领域中正式引入计算机化自适应测试,通过不断为被试匹配更贴近其能力的测试题目,实现对被试能力的精确估计;与传统的非适应性 PISA测试相比,计算机的适应测试将测量标准误差减少了10%,极大提高了测量效度和效率。此外,借助高度个性化定制、智能推荐引擎等技术,评价结果将以交互式可视化的形式及时精准地推送给不同需求者。另一方面,教育评价的证据基础越来越坚实。其一,信息采集能力不断增强,全样本、多模态、大规模评价信息的获取越来越容易,使评价结果的判断依据更充分、更全面;其二,评价活动过程越来越“数据化”,而所有的数据信息及数据操作行为又皆可保存与追溯,使评价活动更具体、更透明,也为加强“元评价”创造了条件。

最后,数智技术优化了教育评价的实施和管理。随着人工智能技术的不断升级,教育评价实施和管理环节的自动化与智能化程度也越来越高。一方面,教育评价实施和管理成本降低,管理效率提升。比如,借助问卷星等在线问卷调查工具、微信等即时通信软件、录音笔等非文字信息采集工具、电子眼与机器人等智能监控工具,评价数据的采集越来越便利;借助以生成式预训练转换模型(Chat Generative Pre-trained Transformer,ChatGTP)为代表的生成式人工智能产品,可以实现课堂中学生学习评价测试题的自动化编写、评阅与反馈,使教师的课堂评价负担减轻;借助网络电视、博客、短视频等新数字媒介,评价结果的传播广度与效果得到了极大提升。另一方面,教育评价的实施和管理更规范也更透明。国家基础教育质量监测与评价是目前我国最大规模、最系统的教育评价项目,该项目目前已经实现了涵盖工具研制、监测实施、数据分析、结果报告与反馈评价等全链条、各环节的信息化管理,极具规范性与公开公正性。比如,其开发的题库系统对题目研发全程进行记录,实现了每道题目开发与修订变化逻辑的全链条追踪与溯源;实施进展管理系统对数据采集、数据上报、施测等全过程进行分层管理,支持不同层级用户在信息系统服务端与移动设备端同时进行工作操作、监控和审核,使每个工作环节规范化、标准化。

二、教育评价数字化转型的根本旨归与核心议题

以数字化为杠杆撬动教育评价深化变革的根本价值追求在于促进学生全面发展,新一代数字技术的发展为真正实现以科学评价促进全面发展创造了新契机。推动教育评价数字化转型,充分利用数字技术和智能技术赋能教育评价提质增效,核心议题在于构建教育评价大数据系统。

(一)促进学生全面发展是教育评价数字化转型的根本旨归

党的二十大报告重申“落实立德树人根本任务,培养德智体美劳全面发展的社会主义建设者和接班人”的教育方针。全面发展是教育的根本目的,全面培养是实现全面发展的基本过程与手段,全面评价是把握和督促全面培养基本过程、衡量全面发展根本目的是否达成的重要手段与保障。

围绕全面评价保障学生全面培养、促进学生全面发展这一根本旨归,借助数智技术对教育评价数据采集、传输、储存、挖掘、分析等的全面赋能,推动教育评价数字化转型,有待实现以下突破。第一,从有限数据评价转向大数据评价。学生全面发展和全面培养的数据信息将被更充分、全面地挖掘和有效利用,教育评价将建立在更坚实的大数据证据基础之上。第二,从线性、不可逆的过程评价转向可回溯、可逆的全息过程评价。随着过程信息被更充分、全面地捕捉和存储,有望突破时间的线性和不可逆性,不仅在过程中进行评价,还可在事后随时对既往过程进行回溯评价。第三,从对既有发展事实的评价转向对发展趋势和取向的预测评价。数据挖掘和分析技术的增强使教育评价既可以对已有的发展事实作出更科学客观的评价,又可以基于事实对未来的发展趋向进行预判,为不断找准学生的最近发展区提供决策支持。第四,从单一标准体系评价转向多维多标准体系评价。一方面,数字世界的发展要求扩充评价标准的数字维度,建立满足多维时空评价需要的多维评价标准体系;另一方面,全面评价和个性化评价的加强也要求进一步完善观照个体全面性、个体间差异性和多样性的多维多标准体系。第五,从以学生认知发展为核心的单一焦点评价转向重视学生的非认知发展及多方育人主体等的全要素多焦点评价。数字技术有效助力评价工具的创新,增强了既往难以实现的对学生非认知发展的测评能力,同时通过提升教育评价效率、降低评价成本等对评价能力的整体加强,使对各育人主体、过程、环境等多方面要素的评价实践成为可能。

(二)形成教育评价大数据系统是实现教育评价数字化转型的核心议题

推进教育评价数字化转型,实现教育评价的深层次变革,核心议题在于借助大数据、人工智能、区块链、数字孪生、元宇宙等数智技术,形成联通多组织层次、沟通多方育人主体和融通多维空间的互联共通教育评价大数据系统,充分整合和调动多方资源、力量,逐步实现教育评价的全方位、全过程、全时空、全要素。全方位即对学生培养及发展的全面评价,包括德智体美劳五育、兼顾认知因素与非认知因素等;全过程即对学生培养及发展的全过程动态性评价;全时空即对学生培养及发展的多维时间和空间的评价;全要素即对学生培养及发展的多方面关键影响因素(包括多方育人主体、条件保障、育人环境等)的评价。

第一,联通学生评价的多组织层次。学生评价可大体分为学校内部评价和学校外部评价。其中,学校内部评价包括学生个体的自我评价、学生间的同伴互评、教师对学生的评价以及学校对学生的评价。学校外部评价包括区县、市、省等教育部门、督导机构等政府部门开展的学生评价,比如期中/期末考试、中高考、荣誉评定、综合素质评价等;还有第三方专业机构开展的学生评价(国家义务教育质量监测、PISA中国测评等),以及科研单位开展的各类调查研究项目中的评价等。教育评价大数据系统将单一组织层内部以及不同组织层次间的学生全过程、全方位的评价数据联通衔接起来,实现评价数据资源的整合和共享,既能节省评价成本,最大程度发挥单一组织层评价活动的价值,又可以减少多头评价给基层带来的评价压力。

第二,沟通学生培养的多方育人主体。培养德智体美劳全面发展的社会主义建设者和接班人,是学校、家庭、社会和政府的共同责任。教育评价大数据系统可以将对学生个体全面发展的评价与对家庭、学校、社会、政府多方育人主体、育人过程和结果的评价连接起来,为进一步充分挖掘诸如教育理念、教养方式、亲子关系、社会经济地位等家庭因素,办学方向、课程教学、教师发展、校园文化等学校因素,社区文化教育资源、社会实践活动组织等社会因素,价值导向、组织领导、教学条件保障等政府因素与学生品德、学业、审美素养、劳动与社会实践各方面发展的关系创造条件。通过加强对学生发展影响因素的全面深刻挖掘与分析,更好地协同多方育人主体力量、规范育人过程、提高育人水平和能力、提升育人质量和效果。

第三,融通多个教育实践活动空间。数字技术的发展将人类的实践活动场域从物理、社会二维空间拓展到物理、社会和信息三维空间,教育评价对象也从发生在二维空间中的教育活动拓展为发生在三维空间及跨空间的教育活动。借助信息空间的时空灵活性、资源共享化、行为数据化、系统联通化等特征及其底层技术优势,教育评价手段、评价工具等进一步创新,评价能力得到极大扩展和增强。比如,可以在信息空间中进行评价仿真实验,提前预判现实评价活动风险,在信息空间中创设仿真评价情境,观察评价对象在特定情境下的表现等。教育评价大数据系统既要融通产生于三个空间中的学生发展和培养等方面的全时空评价数据,又要融合各空间的技术环境和优势,创新评价方式和手段工具,提升评价能力。

三、教育评价数字化转型所遵循的实践理路

形成教育评价大数据系统,构建数字化教育评价体系,实现教育评价的全方位、全过程、全时空、全要素,提升教育评价的科学性与精准性,引导和护航学生的全面培养,促进学生全面个性发展,是推进教育评价数字化转型的终极目的和承继中华民族千百年来“全人教育”、“因材施教”教育思想及理想的必要举措。同时,它也面临着诸多前所未有的问题与挑战,需遵循科学合理的实践理路。

(一)坚守教育评价数字化转型的理念与原则:秉持价值先行和以人为本

教育评价数字化转型中存在着“技术至上”、“数据至上”风险,需要审慎规避。任何技术都不是价值无涉的,在发明之初就具有一定的意向结构、包含特定的价值取向,即技术的逻辑。教育评价的本质是一种价值判断活动,价值逻辑是其首要遵循的本体逻辑。但随着数字技术在赋能教育评价过程中彰显出突出而显著的力量和优势,教育评价的工具价值被不断提升,“数据主义”可能僭越人的主体价值走向“数据为本”的评价范式,教育评价的价值和对象面临异化风险。具体表现在,一是对技术工具理性的过度偏执使评价主客体异位,造成评价主体的决策权力让渡于技术、为了评价而评价的异象;二是数据至上的量化主义评价倾向追求简单、高效、具象、确定性,进而将真实具体的、复杂多样的人异化为抽象笼统的、简单统一的“数据人”,并且基于数据和算法的评价程序整齐划一,缺少教育评价应有的人文关怀和温度。

教育评价数字化转型必须要始终坚持价值先行、以人为本的理念与原则。首先,端正对技术以及教育评价的本质认识,在对二者有限性的理性认知中探寻教育评价数字化的“可为”与“不可为”。第一,要始终明确技术是工具而不是目的。技术是增强和提升教育评价能力、实现教育评价目标的有效手段,数字技术对教育评价的赋能要以遵守教育评价的本质规律与价值诉求为本。第二,要始终明确教育评价的对象是学生而不是其他。教育评价的核心对象是充满可能性与不确定性的学生个体的身心成长与发展状态,技术始终突破不了教育评价活动基于有限取样的推测本质;评价数据本身及数据结果的应用边界具有限度,须加强对评价数据功能限度与边界的考量,赋予数据以人文关怀,审慎解释、应用教育评价结果。其次,教育评价的价值判断权要始终牢牢掌握在人而不是机器的手里。在整体提升教育评价实践者的评价理念、知识、方法、伦理等全方位素养和能力的同时,要放权、赋权给各个层级的教育评价实践者,鼓励他们发挥主体能动性,在参与各个环节的教育评价活动中结合具体情境提出合理建议,做出自主选择,修正或终止评价进程。最后,坚持将以人为本的价值理念贯穿评价活动始终。如在评价标准的设定上,充分考虑评价对象的发展性、个体差异性,兼顾可量化与非量化的发展指标;在评价数据的收集和分析中,关注学生成长发展的整体性、情境性要素,重视促进发展的因果分析;在评价结果的反馈和使用中,体现差异性、针对性、鼓励性等。

(二)筑牢教育评价数字化转型的要素保障:共建教育评价数据质量管理制度

数据是数字化的根基,教育评价数字化要谨防“数据假象”的干扰。数字时代,数据往往被当作描述客观事物、揭示真相的手段,这也是教育评价希冀通过数字化转型提升评价客观性、科学性的价值考量所在。需要注意的是,数据的“客观”极有可能是一种假象,数据提供者对数据理解的差异性、数据的时间持续性、数据录入的准确性、数据更新的及时性、数据样本规模的有限性、“脏数据”的污染、数据分析模型的偏差、数据挖掘的“浅尝辄止”、数据分析结果解读的偏差等都是导致假象的因素。被“假客观”蒙蔽,建立在“假数据”基础之上的教育评价势必无法准确把握真实的教育样态和规律,与教育评价数字化转型的目标相背离。

确保教育评价数据质量有赖于严格的管理与监督制度。教育评价数据是教育评价数字化转型的核心驱动要素,其质量水平直接决定了教育评价数字化转型目标的达成程度。首先,建设专门的教育评价数据质量管理、监督平台与组织队伍。我国拥有着世界上规模最大的教育体系,具备庞大的教育评价数据资源,亟待通过系统性、规范化指导和管理,充分发挥这些数据资源对人才培养和高质量教育体系建设的支撑作用。但目前,我国尚未建立专门的教育评价数据质量管理机构,评价数据质量保证主要依靠数据收集及分析等各有关主体的内部自觉,外部监督、评估及问责极其有限,亟待独立的组织机构及专业队伍组织实施教育评价数据质量监察工作。其次,研究制定教育评价数据操作规范及质量评估标准。组织教育评价、数字技术、信息分析等研究领域的专家学者开展跨界合作,针对教育评价数据操作全程中可能违背人本性、教育性、科学性、客观性等的行为选择,制定操作规范与评估标准,指导教育评价数据操作实践,为教育评价数据操作监管提供依据。最后,完善教育评价数据质量审查与问责机制。教育评价数据质量监管工作的长效开展,有赖于建立一套流畅高效的审查与问责机制,既要明确审查工作目标、流程、方式、人员分工与责权划分等内容,又要厘清教育评价数据操作过程中的质量保证责任人,拟定好基于审查结果的问题示警、追责问责办法。

(三)破解教育评价数字化转型的制度壁垒:建立健全教育评价数据互联共通机制

当前 ,教育评价数据资源总量仍然有限,且已有的评价数据资源因制度性因素尚难实现互联共通。其一,已有的评价数据多集中在学生学业方面,对学生德、体、美、劳方面发展的评价以及相关影响因素的评价数据尚未得到充分挖掘。其二,多源流教育评价数据间存在结构性壁垒,学生评价及培养数据名目繁杂、结构多样,数据清理、数据结构改造等数据融合后的再加工成本极高。其三,教育评价数据持有者间存在组织壁垒,学校、政府部门、第三方专业机构、调查研究项目组等不同类别组织之间、同一类组织不同层级的个体间,在价值标准、利益诉求、行为规范等方面存在复杂冲突,难以达成教育评价数据共享共识。其四,教育评价数据大体量、大范围的互联共通增加了数据泄露、篡改等安全风险,但教育数据安全管理体制机制的建设还处于初步探索阶段。

评价的精准性、有效性需要加强教育评价数据互联共通体制机制建设,着力破除教育评价数据跨组织、跨主体、跨空间的制度壁垒。实现教育评价数据的互联共通,加大对多维多层教育评价数据的搜集、挖掘和分析,使教育评价数据最大限度地被充分有效利用,需要破除现存的制度性壁垒。第一,由教育行政部门牵头,加强学校、政府部门、第三方专业机构、科研单位等组织间的沟通交流,增强对彼此教育评价数据资源优势及需求的相互了解,强化各组织单位对数据互联共通的价值共识,积极调动各主体参与建设教育评价大数据系统的积极主动性。第二,由教育行政部门主导,第三方专业机构和科研单位为主体,学校积极参与、合作开展教育评价数据互联共通体制机制的研究工作,逐步形成统一的数据结构规范制度体系、全面的互通合约制度体系、可靠的技术安全保障制度体系、有力的责权利监管与冲突协调制度体系等。第三,充分借助区块链技术优势,保障教育评价数据互联互通的安全高效性。区块链技术的分布式、去信任、集体维护和无法篡改等特点与数据流通需求有着天然的契合性,是有效解决数据壁垒、信息安全、信任危机等问题的一把钥匙。第四,借助政策仿真实验等技术,提升教育评价大数据系统建设过程中决策的科学性。教育评价大数据系统建设过程中牵涉多方主体、多重利益诉求,其复杂性和高利害性对决策的科学性提出了更高要求。“大数据、人工智能等技术的发展,使得可以前瞻性预测和分析政策实施效果的教育政策仿真成为可能”,教育评价大数据系统的逐步推进应适当借助政策仿真实验的论证和检验。

(四)规避教育评价数字化转型的伦理风险:构建与之契合的伦理保障制度

数据和算法正在成为教育评价活动的主要物质载体,也日益成为教育评价伦理风险的主要来源。首先,在评价数据采集上,个体的生理心理特征、智力能力水平、性格偏好与取向等隐私信息被深入挖掘,但其本人对这些数据的价值以及可能遭到的误用与侵犯却知之甚少。其次,在评价数据的存储上,数字技术的不稳定性与数据本身的高价值性使个人信息面临着极强的泄露风险。在评价数据的分析和使用上,各种统计分析模型是机器对既有数据学习的结果,它建立在一定的历史坐标和文化参照基础上,不可避免地存在一定的历史或文化偏差与偏见。此外,算法工程师个人的性别、种族和年龄等偏见很有可能被复制到算法设计中,从而加剧已有的各种形式的歧视、身份偏见。

教育评价的数字化转型需要构建契合教育评价数字化转型的伦理保障制度。第一,加强教育评价伦理研究,明确数字化转型背景下教育评价变革的伦理原则和规范。基于研究成果对教育评价各环节工作人员开展伦理培训,使其将伦理意识和伦理考量融入行为自觉。第二,尊重和维护教育评价数据采集对象的知情权,坚决抵制在采集对象不知情的情况下过度采集及滥用信息等行为。充分尊重教育评价数据采集对象的个人意愿,确保其对采集什么、用作何处、收益几何等信息的充分了解和无异议。第三,加强教育评价数据安全法律法规建设。针对数字化转型中个人隐私权、信息受保护权等易遭到侵犯的问题,我国已相继出台了《中华人民共和国网络安全法数据安全法》、《中华人民共和国个人信息保护法》等数据安全法律法规。一方面,这些法律法规尚有许多空白、部分法条偏原则化、操作性不强;另一方面,其针对的是一般性的数据安全问题,无法充分观照到教育评价数据的特点及对其安全规制的需要。因此,有关部门有必要进一步加强教育评价数据安全的监管责任及惩戒措施等方面的法律法规建设。第四,提升教育评价活动中分析模型的透明性和可理解性。加强教育评价的数字伦理审查和影响评估,充分关注训练数据的多样性和公平性、分析模型的兼容性和非歧视性、结果的广泛适用性及其影响的长效性。

作者:檀慧玲   北京师范大学中国基础教育质量监测协同创新中心副教授

             王     玥   中国人民大学教育学院博士生

(原文刊载与《教育研究》2023年第12期,p143-151)

分享到:
【打印本页】【关闭本页】