李建龙，牛振东｜“技术-教育” 互构下人工智能赋能高校教学评价研究

作者：发布时间：2025-11-21浏览次数：10

摘要：随着高等教育数字化转型进程的加速，传统高校教学评价模式与数字化教育形态之间的张力日益凸显，对高校教学评价体系提出了更高要求。在此背景下，充分挖掘人工智能在高校教学评价中的功能潜力，已成为推动评价改革的重要路径。从“技术-教育”关系的视角审视，当前人工智能在教学评价中的应用仍面临诸多困境，其根源在于技术与教育未能实现有效互构，导致评价效能受限。为此，提出“技术-教育”互构的实践路径，提升人工智能高校教学评价的实践效能，从技术-教育的协同、合力与互制三个方面，建设“教-学-评”过程性评价体系，促进人工智能高校教学评价的深度应用，构建符合新时代高等教育需求的人工智能高校教学评价体系。

关键词：人工智能；高校教学评价；技术-教育关系；技术-教育互构

一、问题的提出：数字化时代的高校教学评价

数字技术推动的社会转型正在重塑人类的生活方式、生产方式与学习方式，大数据、人工智能、云计算、物联网等新兴技术快速渗透教育领域，人类社会正在从工业时代迈入数字时代，工业时代的教育理念和教育体系无法适应数字时代的发展要求，如何基于新技术变革开展教育实践已成为必须直面的时代问题和教育挑战。高等教育数字化转型本质上是一种范式变革，是将数字技术整合到教育的各个层面，以实现教育服务生态的重组，尤其是人工智能，不仅是教学辅助工具，更具有对教育流程再造的驱动力，对高等教育的结构、功能产生深入影响，如大语言模型（LLM）、语言行为模型（LAM）、视觉语言模型（VLM）等，不仅具有内容自动生成的功能，更展示出思维和逻辑推理能力。

新型技术的教育应用，也让高校教学评价的位置愈发重要。技术在高等教育中的应用效果如何，技术是否真正改善教学质量？这一系列问题都对高校教学评价提出新的要求，教学评价成为观察技术与教育互动的最佳窗口。然而，随之产生的问题是传统教学评价与数字化教育过程之间的不匹配、不适应。数字化时代，高等教育过程中充斥着海量数据、复杂行动者交互与多元场景，教育逻辑从线性转向分布式。面对规模庞大的教育群体，教育者难以全面充分地认识和处理所有教育对象的信息并进行具体分析。传统高校教学评价中，由于数据采集技术和分析方法的局限，评价方式主要依赖一种“小数据”模式，这种评价模式往往受限于评价者的主观臆断，或是依赖基于理论假设的小规模抽样统计，在成本、数据规模、时效性等诸多方面受限。因此，面对高等教育的数字化转型，我国高等教育体系迫切需要建构一种新的高校教学评价模式。

在多种教学评价模式中，人工智能正成为新时代教育评价改革的新方向。人工智能技术在教育领域的引入，不仅重塑了高校教学评价的工具手段与技术选择，更深刻地影响了高校教学评价的结构体系和价值观念。数字化时代，综合理解人工智能在高校教学评价中的多维特征，是深入分析人工智能参与高校教学评价的现实困境及其赋能增能的基础。

二、人工智能赋能高校教学评价的多维特征

人工智能参与高校教学评价，会展现出统筹性、自反性与过程性三大特征，这既是人工智能赋能高校教学评价的实践特征，也是人工智能赋能高校教学评价的现实基础。

（一）人工智能的统筹性：技术性与主体性的双向兼容

随着技术的快速发展，尤其是人工智能、生物技术等领域的突破，技术不再仅仅是人类的工具，而是呈现出越来越复杂的特性。生成式人工智能在与人类交互中，表现出与以往人工智能截然不同的自主交互能力，呈现出一定的主体性特征，形成了全新的人机交互形态。从主体交互的视角看，生物有机体的主体性由自组织驱动的个体与环境交互所定义，人类主体性由情绪、语言和文化驱动的个体与自然、社会文化环境交互所定义，生成式人工智能在与人类交互中呈现的主体性则是由语言生成驱动的交互能力所定义，交互会影响参与者的理解，是一种参与式意义建构过程，“交互主体性”展演了人工智能的主体性特征。

通过人工智能与大数据的技术比较，可以更有效理解技术“主体性”在高校教学评价中的作用。过去一段时间，教育界对大数据赋能教学评价研究呈现出蓬勃趋势，认为大数据参与教学评价可以“精准布点”，数据收集与数据分析的全面性能够满足数字教育时代的教学评价需求。然而，教育过程中产生的海量数据如何选择、组织与利用，是一个科学问题，一旦教学评价涉及的数据并没有得到科学使用，很有可能被教学评价主体“简约”使用，引发技术风险。如教育行动者由一组统计数字或者一组测评数据来表示，人被当作一个可以被计算的物体来对待，教学工作被教学时间、教学强度、加班备案等劳动指标替代，学生学习过程被做题数量、考试成绩、学习时间等锚定，以数据表现的标准化能力或素养,而不重视人的主体性的生成，诱致教育教学陷入一种“劳动控制”之中。对于如何认定教学质量高低，大数据缺乏一种内生性的计算逻辑，难以透析教学过程中多种要素交织互动形成的机制原理，溯因能力不足，难以满足高等教育高质量发展所要求的过程性评价。相对于独立的、与主体相分离的、不变的“实体性”技术而言，人工智能“主体性”技术意味着“关系中”的技术、“解蔽”实体性的技术和“具身性”的技术。人工智能融入高等教育教学过程，与教学诸要素以及技术自身构建新的内在关联，通过关联组合形成复合的技术体系，单数技术、单体技术逐步走向复数技术、技术“域”。

人工智能参与高校教学评价的功能基础，来源于人工智能技术性与主体性的统筹兼容。人工智能具有技术性，强大的算力能够统合数字化教育场景中的各种内容，并进行串并分析、综合分析与立体分析。人工智能拥有处理海量数据的卓越能力，破除了“数据”与“数据处理”之间的区隔，能将教育教学过程中生成的数据直接转送到教学评价，实现教学过程与教评过程的一体化融合，尤其GPT-4这种多模态大语言模型，跨模态迁移更利于破除教学过程与教学评价的时空间隔，加速高级教学评价能力的涌现。以DeepSeek为例，DeepSeek R1模型的深度思考能力，并非外部强化学习，工程师并不告诉模型应该如何推理，而是对模型的运行过程进行激励，实现AI的自我引导和自我调整，在教学评价中，DeepSeek也有自己的解释框架与评价逻辑，生成式人工智能凭借深度学习技术与大规模预训练模型，反映出强大的自主生成能力。人工智能算法具有提取与总结两大核心能力，其中，提取是指大语言模型从文本中提取符合评价需求的特定信息的能力，能够识别数据中的命名实体、关键词、日期、地点等；总结能力则基于预训练的神经网络模型和文本生成算法，结合注意力机制，使得大语言模型对海量数据的关键信息建立逻辑联系，生成概括性回应或总结。技术性与主体性的兼容与联结，让人工智能超越了一般意义上的数字技术，既能自动分析大规模文本和数据，又能生成适用不同领域和任务的多元评价标准，从而减少评价主体主观随意干预引发的问题。

（二）人工智能的自反性：赋能与治理的一体两面

当人工智能与高等教育相遇后，必然涉及两个维度的研究：人工智能技术赋能教育教学研究和将人工智能技术作为治理对象的研究。前者侧重探索人工智能对于高等教育的各种实际作用，包括治理机制、治理主体、治理客体、应用场景等方面；后者则偏重分析人工智能参与高等教育过程中涌现出的诸多问题，发现并治理人工智能教育教学的应用风险、技术伦理与制度控制等问题。“人工智能赋能高等教育”与“高等教育中的人工智能治理”是一个问题的一体两面，二者相互协调、相互促进。那么，如何对高等教育中人工智能进行治理？教学评价正是观察人工智能的教育应用、描述人工智能的实践情况之最佳窗口，从治理的角度看，评价是改进决策，管理知识，提供关于行动的关联性、效率、效益、影响和持续性的可靠证据的重要工具，评价具有治理的功能，通过高校教学评价，以实现人工智能赋能治理。

对于常见的数字化工具，例如大数据、云计算等，它们参与高等教育过程中涌现的问题，一般都是由“他者”（人或新工具）进行治理，“治理”与“赋能”之间存在制度性、体系化的区隔。与之不同，人工智能可以将赋能与治理结合在一起，实现“自我治理”，这是由人工智能的自反性特征所决定的。自反性的基本含义是指主体的行动反过来影响自身以不断发展，自身作用自身。作为现代化重要维度的自反性，其中一个基本论点是，社会的现代化程度越高，能动者（主体）所获得的对其生存的社会状况的反思能力便越大，因此改变社会状况的能力也越大。高等教育评价应当坚持自反性立场，传统教学评价有自身内在的方法论缺陷，即所谓“评价的贫困”——尽管评价结果有统计学上的实证意义，但教学评价未能回溯因果原理，“知其然而不知其所以然”，难以对高等教育产生正向反馈作用。不具有自反性的传统教学评价，逐渐陷入僵化、模板化的困境，评而无用、评而不用、评而不改的事实让其难以助力数字化高等教育的发展，高校教学评价逐渐成为一个隔离的封闭体系。

人工智能因其“智能”而不同于以往的“非智能”技术，关键在于其自反性特征，生成性人工智能具有像人一样的自我影响和持续学习能力。人工智能参与高校教学评价的过程中，能够同步调整自身的教育教学应用，如根据学生的学习情况实时调整知识推送、知识网络与注意力分配，提高教学的针对性和有效性，使得教学评价及时释放教育效能。通过人工智能高校教学评价，不仅能对教育行动者评价，还能对同为教育要素的人工智能自身评价，反思与改进人工智能参与高等教育的不足，实现人工智能更好的教育赋能。“人工智能赋能高等教育”与“高等教育中的人工智能治理”，作为一体两面的关系，得益于人工智能的自反性特征，在高校教学评价中相互交融，实现人工智能参与高等教育的自我反思和自我调节，不断优化多种数字技术的教育应用效能。

（三）人工智能的过程性：终结性评价与形成性评价的并合

高等教育高质量发展，对高校教学评价的高质量发展提出新要求，传统教学评价体系的构建与实施，常以教学课堂为评价空间，以学生考核成绩为评价依据，仅以达成教学目标为标准，突出结果性与终局性，不仅无法统合线上与线下教育的时空范畴，也难以连接课前教学准备、课中师生互动与课后持续学习的动态教学流程。在以结果为中心的教育理念下，传统教学评价存在教学动态评价不足、流程评价不标准、评价碎片化、定量评价谬误等问题，传统教学评价与高质量教育对人的综合性、全面性、动态性要求之间的张力愈发增强。

根据不同的教学评价分类方式，高校教学评价研究之间存在研究视角的差异，可以分为过程性评价、形成性评价和终结性评价。其中，终结性评价是指基于课程目标，对符合目标的、最终学习产出成果进行的评价；形成性评价是指在教学与学习过程中进行的阶段评价，评价对象是为循序渐进达成课程目标的阶段性学习成果；过程性评价是一个本土性概念，是对学习过程中学习动机、态度、行为等过程性要素质量的评价，这种评价方式是对终结性评价与形成性评价的并合与扩展。总体来看，建立以学习者为中心的多元过程化评价与反馈机制，即以“评价即学习”（Assessment as Learning）为核心理念，构建融合形成性评价、过程性评价与表现性数值化的多元化评价体系。

由于教育数据的收集（获取）贯穿于教育活动各环节中，主要来源于课堂教学、自主学习、师生互动、教育反馈等不同教育情境，人工智能将高等教育与高校教学评价塑造成交互的整体构型，不再是纯粹依托考试成绩对教学进行反射性观察，而是直接对教学过程进行观察分析，减少了从“教学”到“教学评价”之间的信息失真与传导损失等问题。这种技术优势来源于人工智能在教育教学中的全流程应用：其一，全时空教学评价。人工智能的全时空场域数据无损采集，为教学评价提供综合性、立体性与全面性的数据支持，避免单一场景信息采集引发的“片面评价”问题，整体性的数据融合与关联分析增强了教学评价的精准性，并以可视化方式描绘教学质量情况。其二，动态性教学评价。人工智能对教与学实时互动的动态分析，为个体行动与社会互动提供“精准画像”，进一步推动教学评价的精细化与个性化发展。其三，全流程教学评价。在评价对象的处理与选择上，人工智能可依托海量数据和算法模型，对评价指标的选择、权重设置等进行自动验证和筛选，提升评价指标的公正性、合理性。

人工智能的时空性、动态性与流程性三方位延伸，极大扩展了教学评价边界，为“过程性评价”创造了动力源。概括地说，人工智能的教学过程性塑造了教学评价的过程性，过程性评价由此成为可能。教育教学的各个阶段的结果被共同整合到过程性之中，学习结果、教学绩效并非不重要，而是强调结果与过程之间的因果联系判断，利用大模型寻找影响学习结果的过程因子，探索最优条件组合，引导师生从表层式学习走向深层次学习方式。

三、理论视角：“技术-教育”互构关系

虽然人工智能高校教学评价具有“可为性”，但实践中人工智能对高校教学评价的赋能效果不佳，出现诸多现实困境。通过“技术-教育”关系视角，分析目前人工智能与高校教学评价的相互构造困境，为人工智能与高校教学评价的良性互构关系提供理论出路。

（一）技术与教育的多重关系

技术与教育素来是紧密的伴生关系。技术可以推动教育发展，正如海德格尔所言，技术所到之处，无不构造着人与自然、人与人的某种新的关系，技术融入教育教学就是与教学诸要素以及技术自身构建新的内在关联。文字、造纸术和印刷术的出现使知识能够得到标准化复制和普遍性推广，知识文本的标准化复制和传播，为现代学校制度的出现和发展奠定了基础。随着互联网、移动手机等电子技术的出现，人类从实体书写进入到数字信息时代，技术革新引发教育“脱域”现象，教育不再被地理空间或场景时间所限制，“教”与“学”可以不同时同步，在时间或空间上实现分离，教育的共时性突破了空间的局限，改变了教育时间的分配和运行方式，教育实践多样性更强。

教育也能促进技术改进，重塑技术逻辑，技术与教育实践呈现出一种改造式的关系状态。在某些情境下，教育具有更高的主导地位，技术不是单方面改进或改造教育实践，而是根据教育需求塑造教育的技术实践形态。技术的教育应用过程并非纯粹的技术理性扩散过程，而是技术的教育意义和价值再解释与再建构的过程。

技术与教育虽然具有双向构造的关系，但也时常出现失衡的情况，难以达到技术-教育的理想互构形态。在技术-教育的关系框架下，二者的不均衡性体现在“技术决定论”“教育决定论”与“技术-教育脱嵌”三种形态。（见表1）

其一，技术决定论。技术决定论认为技术具有自主发展的逻辑，它外在于社会关系与发展态势，并对工作、经济生活和整个社会产生必然的、确定的影响。技术决定论延续工具主义将技术视为外部手段的基本逻辑，在工具主义逻辑的展演下，教育成为技术权力的运行场域，教育变革重心逐渐向数字技术的形式和数量指标倾斜，课程教学围绕着技术逻辑设计，出现盲目跟风建课建资源而忽视教育本质的情况。

其二，教育决定论。该种观点认为，人类作为技术发展的主体，技术发展方向、用途与实践效果取决于人类的主动选择与价值观。技术时代的教育不仅不会沦为被动的对象，而是主动掌控技术发展方向、教育目的和教学实践的主导者，在技术的教育应用中发挥伦理审查和社会建构作用。技术作为附属于教育的工具，仅能体现工具性、手段性、中介性特征，无法有效促进高等教育的数字化转型。

其三，技术与教育相互隔离，即技术-教育脱嵌。在此情境下，技术与教育一般是各自独立运行，形成“两张皮”困境。各种智能系统与线上教学沦为一种形式化表象，仅具有高等教育智能化的合法性外衣，却从不真正接受数字技术对教育教学的赋能效果。教育依然按照工业时代的传统方式独立运行，避免技术干涉或变革，难以实现数字化教育的现代转型。（见图1）

无论是“技术决定论”“教育决定论”，还是“技术-教育脱嵌”，都建立在相同的认识论范式之上，即西方社会科学中长期存在的主客二元认知框架——在技术与教育非此即彼的二元认知中进行判断。教育决定论看似与技术决定论对立，但实际上它同样建立在主客二元的基础上，即技术本身并无内在价值，其意义取决于人的主观赋予。因此，两种决定论视角并非断裂式的范式转换，而是内在逻辑的延展：人工智能与高等教育的关系，被视为一种互为外部性，为彼此所使用、控制的对象，而不是一种与人的实践相互塑造的动态存在。为此，超越技术-教育二元对立视角，需要引入更加综合的理论视角，实现技术与教育的协同演化，在技术与教育的主体间性关系中，建立生成意义上的混合本体论，使其共同服务于人的发展，即技术-教育互构关系。

（二）“技术-教育”互构关系的基本内涵

技术并不必然导向新教育，外源性技术要经过教育的重塑和升级，然后引发教育的变革和重塑，才能实现“教育与技术”的共演变迁。以媒介技术的教育应用为例，以对话技术为核心的启发式教育模式，是口头语言技术媒介被采用对话的方式应用于教育的产物；以线上“脱域”技术为核心的网络教育，是以计算机、互联网技术为代表的数字媒介的现代教育适应性结果。如果新技术涌入教育领域之时，其根本目标并不是为了形成新的教育技术，而只是服务于或用于加强旧的教育模式，那么，这种新技术无法引起教育重塑、教育赋能的结果。人工智能赋能高校教学评价的前提，是人工智能的技术域与高校教学评价的教育域，二者相互融合共生，实际上就是技术嵌入教育、应用于教育，形成新的教育技术。

技术-教育互构，从动态行动看，是技术与教育持续互动以调适双向关系的过程。正是通过这种互动，外源性的技术才能得以被纳入教育过程，“教育的存在最终要以一个‘教育-技术’的方式存在，或者说教育的存在结构是‘教育-技术’结构”。对技术而言，技术欲重塑教育，必须先经过“教育化”的过程迁移到教育领域，取得一个“教育”身份；对教育而言，人工智能、大数据等新技术，需要结合现有的教育现象、教育规律与教育知识，将新技术有机融入教育实践过程，生成“有技术的教育”。

技术-教育互构，从静态结构看，教育和技术双向构造过程也是高等教育的新形态建构，教育实体和技术实体融合为“教育-技术”互构的统一体，并不断向新的主体形态生成的辩证运动过程。技术与教育互构的结构空间，来源于二者共同塑造“人”的内在统一性：一方面，技术是人的本质属性，无论是作为生理性技术的手的技能，还是作为工具性技术的工具和语言，对于人类社会劳动都具有重要意义，在促进人的发展中实现人类社会的发展，技术使人成为人、“技术是人的存在方式”；另一方面，教育也是人的内在规定性，教育是对人的发展与培养，要回答“人要成长为什么人”“人如何成长为这样的人”等关于人的一系列问题，其本质亦是“关于人的塑造和成形的，以时间形式展开的、活生生的、后延性的过程”，因此，围绕人的发展实践，教育与技术的双向塑造统一于人的塑造、人的本质生成。

技术-教育互构的理论视角，来源于技术-社会互构，其认为技术与社会之间相互依赖且相互建构，当新兴技术刚出现之时，技术的“结构刚性”展现，冲击传统社会结构并督促社会结构形式的变迁；当技术应用不断深入，面对技术带来的一系列次生问题，例如安全问题、伦理问题、隐私问题，社会的“结构刚性”入场，要求新兴技术作出调整，对技术本身及其应用作出调适，使其成为社会的新组成部分。技术-社会的互构是技术与社会各自从“结构刚性”转化为交互的“结构弹性”过程，双方各自让渡自身的控制权以形成一个新的“完备结构”，如网约车平台刚出现时，平台会对司机提出一系列劳动控制和工作要求，随着网约车安全问题、外包客服的管理模式以及司机权益保障问题的出现，平台不得不让渡监管权给社会，将数据汲取的管道伸向受人关注的前台，接受社会监管和询问。技术-教育的互构关系也是如此，作为社会重要子系统的教育系统，技术在被教育应用后被教育所建构，与此同时，教育在技术的影响下也改变原有结构，形成更符合现代科学技术的新型结构，进而推进教育自身的发展。

总之，技术与教育的互构是多维度、多方面的，对此，必须强调人作为互构的出发点，以消解教育或技术任何一方“主体性悖论”，坚守教育的“育人”和“生命”属性。

四、“技术-教育”关系下人工智能赋能高校教学评价的现实困境

技术-教育的双向互构关系，是人工智能参与高校教学评价的理想状态。与之相对，在人工智能高校教学评价的实践中，出现了诸多现实困境，既有技术构造教育之困，带来人工智能在高校教学评价中的应用阻滞；也有教育构造技术之难，造成人工智能高校教学评价中的人文价值缺席。

（一）技术构造教育之困：人工智能教学评价的应用阻滞

人工智能为高等教育带来的深度变革与全面转型，不单单是指人工智能介入教育领域引发的技术冲击，更是指在人工智能的冲击下，高等教育系统所处的外部生态与社会环境已经被技术所重构，从而促使高等教育内部的适应性变革。

然而，当技术-教育关系之中技术无法有效构造教育，就会表现为人工智能在高等教育评价场景中应用阻滞，无法实现高校教学评价的数字化建构，具体表现在“主动阻滞”与“被动阻滞”两个方面。

其一，人工智能高校教学评价的主动阻滞。现代教学评价存在一种全面排斥技术主体性的极端态度，认为人工智能将人设置为可谋算的对象，将丰富的人性进行肢解，使人的行为被塑造和定制，教学评价成为人的“物化”过程。该思想背后的谱系，源于人对技术本身的不信任、不认可，对算法所代表的新兴技术厌恶，尤其在高校师生部分群体之中，衍生出批判人工智能评价人类的技术文明叙事，认为一旦人工智能进入高校教学评价领域，会迅速转化为效率、速度、形式、利益充斥的工具，自然成人的教育天性让位于涌现、增强的机器智能。在人工智能教学评价接受度不足的高校，人工智能一般用于组织讨论、生成文本、业绩考核等边缘性活动，核心教学活动中的实际应用却不尽如人意，呈现出较弱的结构刚性，难以充分应用到高效教学活动的多元场景。

其二，人工智能高校教学评价的被动阻滞。面对新技术应用，一旦人工智能无法内化于高校教育的内在结构，高校师生会对传统教学评价工具产生路径依赖。从实践中看，传统教育理念还在限制人工智能的高校教学评价应用，延用旧的评价方法与评价模式——只要旧的机制依然发挥作用，新的教学评价模式就无法入场。传统教学评价依然发挥主导作用，新的人工智能教学评价呈现出实践惰性。人工智能仅停留于表面化的应用，未能深入融合于高等教学评价的核心环节，沦为一种形式主义的技术拼接。究其根源，在于技术-教育之间相互隔离，没有建立良性衔接关系，人工智能高校教学评价变成“为了数字化而数字化”的数字形式主义。一项关于高校智慧教室使用情况的调查结果显示，60%以上的教师无法熟练使用，一定程度上导致高校智慧教室陷入“建而不用”的尴尬状况，最终教育的归教育，技术的归技术，各自运行，难以交互赋能。《2024年中国高校数字化发展报告》提出，2024年AI教育等新技术应用平均增长率从7.2%降至2.5%，部分场景出现停滞，深层次应用开发遇到瓶颈。平台建设完善但使用效能不足，智慧教学平台课程支持率普遍低于30%。一项针对226所高职院校教师的规模调查结果显示，38.1%的教师选择“等到信息技术被证明有用才用，不愿做第一人”，“技术热”背后的“融合冷”问题值得反思。

（二）教育构造技术之难：人工智能教学评价的价值紧张

人工智能的算法模型常常被形容为“黑匣子”，其推导原理、计算过程与判定依据不清楚，可解释性弱，师生难以理解其评价结果的底层逻辑。算法的不透明性带来人工智能教学评价的合法性缺失。一方面是社会合法性缺失，高校师生难以理解和信任机器评价发生的过程和结果，无法取得技术信任，这会限制人工智能参与高校教学评价的实践应用与社会扩散，人工智能教学评价可能陷入应用阻滞，因为在某种程度上，社会合法性是同构效应的重要动力；另一方面是科学合法性缺失，算法黑箱无法经受科学性检验，更无法在教学评价实践中得到调整与反馈，容易失去科学的合理性基础。

当技术-教育关系之中教育无法有效构造技术，会引发人工智能在高等教育评价领域中失去价值理性，难以保证高校教学评价的公平正义。人工智能的教学评价结果，在很大程度上依赖于“数据训练”与“算法设计”质量。

一是训练数据的质量。如果训练数据存在谬误、错误或者偏见，数据集本身不具有广泛性和代表性，无法对高校群体的共性与异质性进行涵盖，那么人工智能输出的评价结果可能存在偏见或错误，对带有某些行为特征的高校成员个体或群体进行负向评价。由于智能系统的原初数据主要由人类程序员所喂养或训练，在特定训练数据影响下会具有“偏见”构型的风险，即“BIBO”（Bias In, Bias Out）定律。

二是算法设计的逻辑。算法本身的模型设计是一个带有目的/意义的范畴，理论模型为人工智能的算法设计与逻辑构建提供指导，模型生成和优化带有“目标偏好”，如效率、公平、再分配等多种竞争性目标的选择与调适。人工智能的算法开发者在设计阶段较难价值无涉，使得人工智能算法的运算过程存有一定的价值负载性和道德意向性，被人类伦理规范的隐性构架影响。教育构造技术的前提在于技术方与教育方能够对人工智能教学评价中诸多数据与算法进行沟通与协商，以共同再造教学评价算法逻辑的科学性与合理性。如果算法无法被解释，无论是算法建立之时的决策规则和权重分配，还是算法做主调试相关参数的“涌现”，教育行动者无法理解算法逻辑，算法对教学质量的评判标准缺乏解释，教育主体无法有效借助数据或算法，对人工智能的技术理性进行有效调适，无法实现教学评价与教育教学的良性衔接。

在技术缺乏教育构造的情况下，人工智能的高校教学评价应用很可能是“机械式”，高校采取人工智能教学评价，并非真正利用其提升评价效率，而是形式主义地展演，形成技术应用的“剧场效应”而非实质效用。一旦失去教育理性的人文干预与道德矫正，人工智能与高校教学评价之间会失去平衡，更无法形成新的互构统一体，智能技术的主体性容易演化为主体替代性，强势消解高等教育的实际需求。

五、“技术-教育”互构中人工智能赋能高校教学评价的实践机制

通过技术-教育互构，实现人工智能与高校教学评价的双向融合关系，从实践方面看，要从技术-教育的协同路径、合力路径与互制路径三方面入手，提升技术-教育互构的可操作性，推动人工智能为高校教学评价赋能增能，助力实现高校教学评价的数字化革新。

（一）技术-教育协同路径：建设“教-学-评”过程性评价体系

技术-教育协同，是技术-教育互构的前提。技术与教育之间首先应形成协同合作关系，才能为人工智能高校教学评价建立基础。人工智能深入影响教育教学的各个场景、不同环节与多元领域，在过程性评价的思维影响下，人工智能与高校教学评价能够形成协同关系，建立“阶段+结果”的过程性评价体系，并合形成性评价与终结性评价，以准确评价师生全方位发展的情况，达到“以评价促进发展”的目的。

其一，建立教学行动与教学结果的关联互动模型。高校应将互动数据、增值数据、情境数据等全面纳入教学评价体系，加速人工智能的教育化进程，并通过人工智能的行为挖掘能力，探索教学过程中相关行动的实际效能，使教学评价的过程评价要素与结果评价要素关联，有效破解教学评价中结果评价与阶段评价的“两张皮”问题。

其二，完善人工智能高校教学评价的规范标准。一方面，高校课程要素数字化。高校教学评价体系应当明晰评价指向的对象类型、收集何种数据以及评价对象如何转化为数据等，数据必须准确反映课程教学的实践过程。同时，根据评价目标，科学分配评价指标的权重比例，形成“评价目标-评价数据”相观照的科学标准体系，为人工智能的算法模型创造数据基础；另一方面，高校教学评价标准规范化。要注重教学场景与教学评价标准的适配性，对于不同的高校教学场景采取差异性、多元性的评价标准，例如有的场景追求效率，有的场景侧重公平，不同场景的评价需求指向不同的算法机制。

其三，建立一体化教学评价流程。破除“线上-线下”“虚拟-现实”的二分法，建构一体化高校教评流程。不同于一般的教学评价领域，高校教学评价对评价整体性、评价综合性要求更高，很多知识生产来源于课堂之外，超越单一的授课场景。围绕教学或学习流程，对学生学习状态评价，从课前、课中与课后阶段开展包括学习状态、成果质量、思维逻辑等全要素的数据记录和追踪，全方位透视学生学习能力与学习质量。涉及高校教师教学质量评价，则按照综合内容设计、课堂实践创新、师生互动效果的不同维度展开，形成教师的教育教学评价链条。通过教育链条生成教学评价链条，探索建立“形式评价、内容评价和效用评价”三位一体的“全评价”体系，全面分析教学要素与教学产出的科学关联。

（二）技术-教育合力路径：促进人工智能教学评价的深度应用

技术-教育合力，是技术-教育互构的动力。人工智能与高校教学评价的深度融合，需要从技术-教育合力思维出发，提升人工智能教学评价的规范性、有效性与系统性，积极释放人工智能高校教学评价的治理效能。

其一，规范过程流数据格式，建立高校教学评价数据库。针对高校场景中评价对象或评价目标，建立规范性、立体化的评价指标框架，深入分析评价所需的教学过程中能力、互动与成绩的内涵与特征，将合理教学要素纳入指标体系，完成评价对象从“质性内容”到“数据形态”的转换。同时，有机整合所有评价指标，系统提取、有序分类与统一整合相关指标内容，形成高校教学评价指标体系的一级、二级与三级维度，建立过程流数据库，便于人工智能的过程性评价机制建设。建立连续性数据统合系统，可以尝试使用HDFS或NoSQL等分布式存储系统确保数据的连续性累积与容错，形成结构化教育评价数据库。

其二，强化教学评价模型的因果流能力。过程性评价不仅是对过程要素的平面评价，还要探索形成性评价要素与终结性评价要素之间的因果关联，即教学要素与教学产出的输入-输出关系。传统的OLAP（在线分析处理）技术、大数据模型、多因子教学评估等技术，过多侧重相关性，因果分析能力与解释能力不足。一方面，注重不断改进多层神经网络的因果分析准确性，配置持续合理的训练激励机制；另一方面，要对人工智能教学评价的因果判定进行深入解读，对量化因果关系的复杂形成机制进行质性分析，便于教学评价的教育应用。

其三，完善人工智能教学评价的“评价-反馈”闭环流程。由于人工智能具有合并形成性评价与终结性评价的过程优势，在过程性评价之中，人工智能可以将评价结果直接转送到新的教学过程之中，即“在过程中完善过程”，这为“评价-反馈”的即时建设提供机遇。建立健全衔接有序、环环相扣的“问题收集-分类处理-督查核实-反馈检查”闭环流程管理机制，并尝试利用新的算法嵌入，实现教学评价与教学评价应用的双向反馈与循环对接。以无痕采集多模态真实数据还原教育过程，助推算法提取教育“真”问题，并借助人工智能给出解决方案，再以人机协同方式总结提炼教育知识、归纳教育规律。

（三）技术-教育互制路径：完善人工智能教学评价的动态调控

技术-教育互制，是技术-教育互构的保障。技术与教育之间不仅具有共生共惠关系，还要有相互制约关系，以规避人工智能高校教学评价的潜在风险。人工智能与高校教学评价的互构，不仅体现在协同与合力，还表现在相互制约，通过技术与教育之间的约束性平衡，规范技术使用和行动者行为，创造更为合理安全的教育环境。

教育制约技术，要求增强人工智能教学评价算法的可解释性。人工智能对教学质量的评价关注哪些内容，这些内容如何分配权重、如何组织起来形成评价结果，都需要得到算法说明与制度规划。对此，建议在深度学习模型中嵌入逐层相关传播方法，解释学生知识学习的评价机理，或者借助图神经网络、可视化解释系统以及可解释框架等，推动被评价者理解人工智能的评价过程，增加被解释者的接受程度，并以制度规范的形式公开展现，提升算法解释的制度规范水平，便于伦理审查与规范分析。在解释与理解算法的基础上，建立算法协商机制。“算法协商”是人机协同评价的创新性体现，在算法建构阶段，既要利用公平性度量标准识别并诊断算法偏见。

技术约束教育，要求高校积极适应人工智能的教学评价转型，技术刚性在一定范围内重塑组织结构与评价流程。为进一步适应技术变革和迭代，高校应当建立统一性的教学评价平台，建立开放的沟通机制，促进高校内部的评价知识和评价技能共享。在此基础上，建立有效的知识管理系统，以支持参与者的持续学习和有效应用，并对参与过程中出现的问题进行统一更正反馈，构建具有线上参与-线下响应的高校教学评价平台，提升人工智能教学评价的参与响应能力。

（李建龙，北京理工大学教育学院博士研究生，中国人民公安大学发展规划与学科建设处副处长；牛振东，北京理工大学教授）

（来源;《中国高教研究》）

进入导航

李建龙，牛振东｜“技术-教育” 互构下人工智能赋能高校教学评价研究