货拉客微商网 发表于 2024-2-28 05:26:02

对话 | 学评融合: 人工智能时代的教育评价

人工智能时代评价的理念立异

魏宁:2020年,中共中央、国务院印发了《深化新时代教育评价改革总体计划 》,明确指出“教育评价事关教育成长 偏向 ”,要求“系统推进教育评价改革,充分施展 教育评价的指挥棒作用,努力培养担当民族中兴 年夜 任的时代新人,培养德智体美劳全面成长 的社会主义建设者和接班人”。

在二十年夜 申报 中,也明确提出了“深化教育领域综合改革,完善教育评价体系”的要求。当前,在党的二十年夜 申报 对新时代新征程教育事业作出的战略谋划下,我国教育领域正在全力奋进。张教授,您如何看待新时代教育评价的重要意义?

张生:近年来,教育评价在教育改革中的导向作用愈加凸显,适才 你提到的《深化新时代教育评价改革总体计划 》,对教育评价改革做出了顶层设计和具体安排 ,但改革的症结 在于落实。

特别是随着以互联网、年夜 数据、人工智能为代表的现代信息技术的快速成长 ,评价手段更为丰富、多样,为评价改革带来了新的契机。当然,这也迫切需要我们加紧探索,对新时代的教育评价给出有力的回答。



魏宁:您提到了新技术成长 对教育的冲击,我想这对于教育评价来说既是机遇,也是挑战。《深化新时代教育评价改革总体计划 》中就特别指出,“立异 评价对象 ,利用人工智能、年夜 数据等现代信息技术,探索开展学生各年级学习情况全进程 纵向评价、德智体美劳全要素横向评价。完善评价结果运用,综合施展 导向、鉴定、诊断、调控和改进作用”。您如何看待人工智能时代的教育评价?

张生:人工智能时代的教育评价改革呼唤理念与实践立异 。实践立异 的根源在于理念立异 ,没有先进的理念引领,实践难免落入窠臼。

21世纪以来,随着心理与认知测量技术的成长 ,评价也从“为了结果的测量”转向“为了诊断和改进”,“以学习为中心”的评价理念逐步成为共鸣 。但受制于学习环境与技术条件,“以评促学”在教育实践中依旧存在不少问题。

当前,教育已经进入人工智能时代,在物理世界与数字世界双重成长 的基础上,深入研究教育评价的新理念、新办法 和新技术并运用新模式,是增进 教育评价改革的症结 。


魏宁:在以往“以评促学”的实践中,存在哪些问题?我们应当怎样解决这些问题?

张生:首先,是评价与学习分别 的问题。为了实现对学习进程 与结果的精准判断,评价就必须与学习坚持 高度的同步性。

例如,在学习进入新的阶段前,应尽快发明 并改进上一阶段存在的毛病 概念,以免影响后续的学习,这也是形成性评价涌现 的主要动因之一。

但目前的评价更多是外在于学习进程 的活动,这就导致评价给学生和教师带来了额外的累赘 ,如过于频繁的测试、学习进程 中提交的文件和照片等记录性数据。这些都是评价与学习分别 带来的问题。

其次,评价对学生认知的影响有限。这表示 在:一方面,评价主要指向学习的行为与结果层面,评价指标中包含了年夜 量的造诣、奖状、证书类的结果性指标;

另一方面,仍有年夜 量学习进程 游离于评价之外,特别是一些涉及高阶思维、开放性和主不雅 性强的问题。这些都让当前的评价对学生认知的影响有限。

再次,学生尚未成为评价活动的主体。评价的目的是提供学习反馈,反馈只有被学生使用,并为其所吸收,能力 起到改进学习的作用。
在传统评价中,学生只是被动地接受评价。随着评价理念从存眷 结果转向支持学习,学生的自评和互评才逐步进入教育工作者的视野。但总的来说,学生在评价中的介入 度依然较低。

我们认为,解决上述问题的症结 是让学习和评价真正融合起来,树立并践行学评融合的理念。评价不仅是对目标是否实现的判定,更要通过评价中涉及的发明 、检验、反思、评论、介入 等进程 直接增进 学生高阶思维的成长 。

学评融合超出 了对知识技能的学习结果及学习进程 的测量,指向了更深条理 的支持学习的“元学习”,也就是“学会如何学习”。

学评融合是对学习进程 评价和学习结果评价的融合统一,通过将评估要素融入学习活动,不仅能真实地反应 学业造诣 ,优化学生的学习,还能进一步助力学生未来的学习,增进 终身学习能力的提升。


魏宁:您适才 提到了要让学习与评价融合起来,对于学评融合这一理念,能否给出更详细的解读?它的概念和内涵是怎样的呢?

张生:我们认为,学评融合是基于数字世界的教育。当前,数字文明信息极年夜 丰富,人才培养目标赓续 转变,基于评价进程 和结果运用提升小我 、群体思维和数据决策等高阶思维能力,是教育评价理念改革 的症结 。

学评融合理念是统筹评价的学习性和诊断性为一体,强调以多种方法 增进 学生主动成长 的一种评价新理念。它强调通过数字世界将评价融入到学生的学习活动进程 中,勉励 人人展示分享结果 、人人介入 系列评价活动,基于评价进程 与评价数据赓续 反思改进,增进 学生自身核心素养的成长 ;通过数字世界记录的学习进程 数据和评价进程 数据,建立各类 模型来计算学生认知、社会性、心理等多方面素养的成长 ,再以可理解的方法 涌现出来。


魏宁:相对于传统的教育评价,学评融合有哪些鲜明的特征呢?

张生:学评融合的评价理念有别于传统的评价理念,它至少在五个方面表示 出鲜明特征:

一是强调评价的学习性和诊断性的融合。这是学评融合理念的首要特征,指先施展 评价的学习性功能,再基于学习进程 数据进行数据建模评价,这不合于传统意义上先诊断再改进的评价理念。它的评价流程更简捷,更能指向学生核心素养的成长 。

它强调依托数字世界,将评价中的各核心要素融入到学习活动中,以学生为主体,勉励 人人介入 展示、人人介入 对他人的评价,让每一位学生都能在评价活动中提升自己的核心素养,通过评价反馈改进学习。

二是强调评价进程 是一种高阶思维的学习活动。学评融合强调学生在原有认知展示基础上,在阅读他人作品、评价并提出改进意见的进程 中,思维再次获得 升华,思维的深度与广度得以成长 。

这个进程 既是总结他人优势与不足、加深对同伴认识的“知彼”进程 ,又是通过对他人作品进行评价,逐步认识事物的多面性,进而改进自己作品的“知己”进程 ,通过“知己知彼”的评价活动,成长 核心素养,提升思维境界。

三是强调基于学习进程 的诊断评价。学评融合通过物联网技术、年夜 数据挖掘技术和智能决策与可视化技术,建立学生的认知成长 、学业成长 、社会性成长 等不合方面的计算模型,以及一系列决策预警剖析 模型,并基于不合地区 和群体特征构建不合的学习者特征模型,可以实现动态诊断、决策反馈。不仅能够涌现学生当前的成长 状况,还能对未来的成长 状况进行模拟推演,从而提早采取办法 调剂 教育教学。

四是强调对数字世界的运用。学评融合一定是基于数字世界开展的评价,只有这样能力 充分施展 数字世界展示、分享、交流、评价、自动计算、智能决策和可视化的优点。在人工智能时代,数字世界的时空泛在、物理世界的时空拓展,让人人展示、同伴评价、小我 反思与改进可以常态化地开展,学评融合的高阶思维特点可以获得 常态化的训练和成长 。

此外,数字世界能够年夜 范围 、常态化、个性化地进行数据剖析 ,不仅能为小我 提供有针对性的学习进程 申报 ,提出有针对性的建议,助力个性化学习,还能支持科学治理 与决策,及早发明 区域性、群体性问题,进而年夜 幅度、年夜 范围 提升教育教学质量。

五是强调坚持 学生的好奇心。这是学评融合最症结 的特征,评价的目的是让学生体验自身的进步和胜利 ,坚持 与生俱来的好奇心。在传统评价理念下,评价与学习分别 ,整个评价进程 完全由教师主导,学生则是被动地接受评价,这抹杀 了学生的好奇心。

而在学评融合理念下,人人都能展示自己的优点和不合,也可以发明 他人的优点和不合,进而对事物保有充分的好奇,营造出积极向上的育人气氛 。



魏宁:在践行学评融合这一新的评价理念的进程 中,新技术无疑将施展 重要的作用,可以说,学评融合的落地有赖于全新的数字化环境,您如何看待技术对学评融合的常态化、可连续 开展的推动作用?

张生:新技术对学评融合理念的落实有着重要的推动作用,这主要表示 在三个方面:

第一,技术可以有力推动学评融合的日常化。学评融合中症结 的自评与互评环节,就有赖于信息技术对物理学习空间的时空拓展。将评价活动内置于学习平台中,一方面让评价成为师生的“划定 动作”,使其养成评价的习惯,另一方面支持了教师和学生的多样化选择,为师生的日常应用创造了更好的条件。

此外,学生还可以随时随地在平台上对自己或他人的学习情况进行回顾总结、评价反思,如在学习平台上撰写学习日记,针对不合学科的不合知识点或内容进行自我评价,以文字形式评价自己是否达到了阶段性的学习目标,剖析 自己在学习中支付 的努力,对当前的学习结果进行归因并提出下一步改进策略,等等。同学之间也可以随时进行交流与互评。

第二,技术可以有力提升学评融合的认知品质。通过信息技术对时间和空间的延展,学生有机会从年夜 量的同伴表示 中汲取可借鉴之处,拓展自己的思路,加深对主题内容的理解,这为学生创造了多元的评价机会,成为提升认知品质的重要手段。

此外,在运用评价标准和对评价标准的内化进程 中,学生的评估素养和学习能力将同步获得 提升。通过为教师提供的将评价标准内嵌于平台的功能,要求学生在评价进程 中必须明确自己的评价依据了哪一条标准。还可以通过设置评语最少字数、监测评语内容与评价标准相关性等方法 ,减少随意评价,让评价进程 及内容紧紧聚焦学生认知与元认知的成长 。

第三,技术可以有力增强学评融合的介入 性。围绕核心素养的学评融合,实质 上是一种高阶思维的学习活动。同伴互评产生的质疑、争辩、论证等交互行为,不仅能增进 学生的反思,并且 能激发群体互动的气氛 ,使学生深度介入 到学习和评价活动中来。

因此,网络学习平台必须具备允许被评价者依据反馈对评价者做出回应和质疑的功能。因为,能够引发被评价者回应与讨论的评语往往是高质量的评语,支持对评语的再评价或反馈,是对提升评语质量的一种勉励 ,是对成长 学生高阶思维能力的增进 ,要勉励 学生给出切实、中肯、有针对性的评语。还可以创造更丰富、更具选择性的技术环境,如让学生自主选择评价对象或选择自己被哪些人评价,从而建立起学生对评价活动的积极预期,增加对学习及评价任务的认知和情感投入。

人工智能时代评价的实践形态

魏宁:通过您的描述,我们了解了学评融合理念下的教育评价的基本样貌,这种以数字世界的运用为基础的新型评价理念,在教学进程 中是如何开展的呢?

张生:学评融合在实践中的运用,重点强调评价的学习功能和诊断功能。在实际操作中,评价作为一种高等 思维的学习活动,包含 生成与展示、介入 评价活动、反思与改进三个核心阶段。

其中,学生思维的生成与作品的展示是学评融合理念落地的基础,它强调教师要利用数字世界重构育人环境,优化学与教的方法 ,强调学生从消费为主转变为生成为主,从而形成为了生成而消费的新型教与学方法 。在学生生成的基础上开展人人展示,展示可以在物理世界中进行,但我们更强调的是让常态化展示和分享产生 在数字世界中。

以人为核心开展自评或他评的学习活动是学评融合理念落地的症结 ,我们提倡 跨学科的教研方法 ,核心就是评价一定要以人为出发点。岂论 自评还是他评,都是学生在主动介入 评价,通过多种方法 的评价,促使学生不再停留在原有的简单认知上,进而萌发出对事物更深条理 的理解。

及时性和迭代性的反思与改进是学评融合质量的提升要求。岂论 是从评价还是从支持自我调节学习方面看,目前年夜 多半 的研究还未能聚焦反思阶段,而学生利用评价行为表示 信息在反思阶段做出改进是至关重要的。在介入 评价活动后,学生将发明 很多相似或完全不一样的作品,从而拓展思考问题的角度和方法 ,以此为基础的反思和改进将是认知水平的又一次提升。



魏宁:通过您的介绍,我们看到了学评融合在物理世界与数字世界中相互交融的美好场景。要想开展这样一种基于高阶思维能力的、核心素养导向的评价,新技术和新办法 是必弗成 少的。其实,在目前的教育评价中,也有不少的技术对象 用来支持评价活动的开展,您觉得这些对象 存在怎样的不足?

张生:以同伴互评这一常见的评价环节为例,相关的支持对象 可以说异常 之多,如PeerGrade是一款支持作业互评的对象 ,Peerceptiv是一款支持“写作”的文本互评对象 ,PeerWise是一款支持“出题”活动的对象 。

像这样的支持互评的对象 还有很多,Luxton-Reilly就曾经系统梳理了18种同伴互评对象 ,它们年夜 都支持评价标准的设置,以及评分和评语两种评价方法 ,在一定水平 上增进 了同伴互评的开展。但它们普遍缺乏对评价者与被评价者之间交流讨论的支持,难以通过交流讨论进行迭代反馈。

总的来说,这些互评对象 主要是站在评价的诊断性角度设计的,还不克不及 满足我们提倡的学评融合下的个性化需求。



魏宁:在学评融合环境中,可以通过什么办法 、对象 克服这一缺陷呢?

张生:要想让学评融合这一新理念变为现实,离不开数字世界中全新的评价环境的创设。在目前的教育评价环境下,更多的是以诊断性评价为主,这晦气 于开展普遍 、深入的评价交互,学生的主动性、个性化需求都难以体现。

因此,以个性化、项目化、数据化、极简化为原则,立异 性地设计各类 评价对象 和环境,对学评融合的高质量开展具有重要意义。

《义务教育课程计划 (2022年版)》中将更新评价不雅 念、立异 评价方法 办法 作为深化教学与评价改革的重要侧面,提倡开展作品展示、口头申报 等评价活动,存眷 提高自我评价、总结、反思和改进等能力的功能。在学评融合的环境设计中,我们以主题论坛为载体,设计包含 评价卡、实时反馈等对象 在内的评价环境,用来增进 学生高阶思维和核心素养的成长 。

具体来说,是借助主题论坛实施评价,主题论坛支持点赞、评分、评语等多种评价方法 ,以及文本、图片、音频、视频等技术手段,可以满足学生的个性化评价需求。在主题论坛中,师生可以自主选择同步、异步两种交互形式,在交互中建构知识、成长 能力。

同时,学生在论坛各个环节的宣布 、回复、评论、反馈等内容都将累积形成数据库,用于多种特征的诊断,为教师改进教学、学生自我反思提供依据。

在进行评价时,我们为学生提供在线的评价卡。当学生出题时,它就是一块“答题板”,支持出题、做题两种活动形式;当进行他评时,它就是一块“评分板”,支持标准设置、自主选择。在评价活动中,评价卡产生的进程 数据可以挖掘学生的领域能力、评价能力、评价偏好与习惯等,作为教师改进和学生评价的依据。

实时反馈对象 也是实现学评融合的症结 ,它重在实时性和可视化,可以增进 学生对作品与评价的及时理解和改进。一方面,技术环境在展示、互评、反馈等各环节无需时间间隔,使学生能够实时改进学习;

另一方面,实时反馈对象 可以通过“散布 ”功能,以图表的形式展示评分、作答数据散布 ,通过“排行”功能,以排行榜的形式展示评价介入 情况排行,这些方法 都以可视化的形式直不雅 涌现庞杂 数据,增进 师生的理解和改进。

实时反馈还有助于学生在群体中构建个别 经验,调节评价进程 。可视化能够赞助 学生在评价中了解自己,也了解他人,做“知己知彼”的评价,明晰自己在一个群体中所处的位置。



魏宁:学评融合理念下的个性化评价的具体应用流程是怎样的呢?

张生:学评融合理念下的个性化评价,一定要以常态化应用为目标。依托上述的主题论坛、各类实时反馈对象 ,由师生配合 完成评价活动,实现评价的学习性和诊断性功能,增进 学生高阶思维和核心素养的成长 。下面我为年夜 家描述一下它的应用流程。

首先设计评价项目,教师在主题论坛上使用评价主题、评价卡创设与学习目标相关的任务情境和活动计划。例如,培养学生的识记能力,教师围绕这一内容出好题目,提供评价标准,学生依据标准比较 自身评分、教师评分和群体评分的差别 。

在评价任务宣布 后,师生需要应用评价卡分组完成评价。学生可以选择文本、图片、音频、视频、测试题等形式展示自己的作品,并通过点赞、评分、评论、评价卡答题等方法 开展评价。学生还可以通过设置分组的名称、类型和优先级,选择期望介入 评价的主体,筛选评价对象,满足自己的个性化需求。

在整个评价进程 中,学生可以通过实时反馈对象 的各类 功能查看评价与被评价数据的情况,查看不合选项和得疏散 布 ,查看群体介入 情况排名,接收到被评论的提示信息,在群体中展开深条理 的交互反馈,通过协商调剂 作品和评价。教师可以通过实时反馈对象 查看特定群体的作答情况和评疏散 布 ,了解学生间的差别 ,借助回复、评论等功能为学生提供指导,保障活动按计划进行。



魏宁:我们看到,学评融合下的个性化评价的应用流程在评价活动的设计上和技术应用的方法 上都是异常 丰富的。那么,在日常教学中,它又有哪些典范 的应用场景呢?

张生:其实,学评融合下的个性化评价可以和日常教学的多种场景融合,既可以作为自力 的项目式课程,也可以作为一般课堂中的一个评价环节,还能作为课后的项目式作业。不管哪种应用场景,它都需要经历“生成与展示”“介入 评价活动”以及“反思与改进”三个核心阶段,然则 每个阶段的连续 时间、庞杂 水平 需要依据 具体情况灵活调剂 。

例如,在自力 的项目式课程中,要把提高学生的评价能力作为课程的重要目标,教师需要创设多样化的评价情境,让学生普遍 、深入地介入 到评价标准制订、作品展示与评价、评价结果解读等活动中,每个活动都要经历生成、展示、评价、协商、反思、改进的进程 。

在一般课堂中的评价环节,由于时间有限,需要教师结合具体教学内容,剖析 评价需求,重点围绕当前教学设置评价项目。如果教学目标指向知识记忆,只需让学生回答相应题目,再查看答题结果散布 ;如果教学目标指向知识的深度理解和高阶思维能力,则需要让学生出题、答题并评价题目;如果教学目标指向人际沟通能力与作品理解能力,则需要开展“评他”活动,即让学生对他人不雅 点予以评分或评论。

人工智能时代评价的方法 选择

魏宁:在人工智能时代,多种技术对象 的介入、多样化评价方法 的设计,使得学生能够以加倍 多元化的方法 展开评价,年夜 年夜 丰富了传统意义上的评价办法 、手段、路径,为学生的评价提供了更多的选择。在这种配景 下,学生更喜欢怎样的评价方法 ?在评价的选择上,有没有一定的偏好?通过您的研究数据,能否为我们揭示一些这方面的“纪律 ”呢?

张生:随着人工智能时代的到来,学生的评价方法 也在赓续 成长 、立异 ,各类 新型的评价方法 赓续 涌现。在学评融合进程 中,学生可以自由选择评价方法 ,我们通过对年夜 量的学生评价数据的调研与剖析 ,对学生在评价方法 选择上的偏好以及不合选择带来的影响进行了一些初步研究,下面和年夜 家分享一下我们的研究结论。

在评价方法 的选择上,我们通过年夜 量调研发明 ,经常采取 评分方法 的学生略多于采取 评语的学生,在采取 评语的学生中,年夜 约有五分之四的学生选择文字方法 ,只有约五分之一的学生选择音频或视频方法 。

在不合性别学生的选择倾向上,男生更多地选择评分方法 ,而女生更青睐于评语的方法 。在评语方法 中,岂论 男生还是女生,选择文字方法 的比例都远远高于选择音频或视频方法 的比例。

从学段上看,随着学段的升高,选择评语方法 的学生赓续 增多。具体来看,各个学段中学生选择文字方法 的比例都远高于选择音频或视频方法 的比例。

透过这些评价方法 选择的数据外面 ,我们还对不合评价方法 选择对学生评价反思能力的影响进行了进一步的研究。

通过研究,我们认为,首先,倾向选择评语方法 的学生的评价反思能力更强。相对于评分方法 ,评语方法 要求学生在评价活动中更充分地阅读与比较,发明 他人作品的优势,更深刻地反思自己的作品。

与此同时,写评语的进程 自己 就需要学生投入更多的时间与情感,这能让学生更好地舆 解评价的意义,深化对评价进程 的价值认同。当然,这也不料 味着评分方法 就全无价值,对于评分这一方法 ,可以通过设置多维度的评价标准、给出每个品级 得分的具体表示 性描述等办法 ,让评分的价值得以更充分的施展 。

其次,上面的查询拜访 数据告诉我们,在评语方法 中,选择文字方法 的学生远高于选择音频或视频方法 的学生,这是由平台技术的限制、学生相关经验较少、音视频表达方法 仍较为浅显等多种原因造成的。

其实,音频或视频的评价方法 包含的信息量更多,思维交互的条理 更深,具有奇特 的优势。如何充分施展 音视频评价方法 的这些优势,让更多的学生测验考试 这些新型的评价手段,是今后有待进一步加强的处所 。

总的来说,在人工智能时代,评价方法 的多样化进一步增进 了学习与评价的融合。在学评融合理念下,评价的技术手段包含 文本、音频、视频、直播视频等,评价方法 则有评分、星级评价、点赞、评语、价值判断、答题板等。这些不合的手段、方法 ,结合学生的特点,经过合理的设计,必将施展 出评价的优势,提升学生的思维条理 ,增进 学习与评价的融合。


魏宁:这些基于真实评价数据的查询拜访 与剖析 ,我想在某种意义上,是有趣的,更是有价值的,对于在数字化环境下开展教育评价的教师而言,有着重要的启发。感激 您为我们分享这些名贵 的研究结论。最后,关于人工智能时代的教育评价,您还有怎样的期许?

张生:在人工智能时代,我们每小我 都生活在两个世界里,在物理世界之外,数字世界里同样有一个我和你。新型的育人环境一定是物理世界与数字世界共存的,新时代下新的教育评价体系也一定要买通 两个世界,以提升学生高阶思维与核心素养为目标,增进 学生的全面成长 ,为国度 培养更多的有用之才。

魏宁:感激 您的分享,让我们配合 期待人工智能时代的新型教育评价体系能成为教育改革与成长 的助推器,为培育未来人才施展 出更年夜 的作用。


引用请注明参考文献:
张生,魏宁.学评融合:人工智能时代的教育评价.中国信息技术教育,2023(19):4-11.
页: [1]
查看完整版本: 对话 | 学评融合: 人工智能时代的教育评价