实锤作弊,阿里达摩院翻车后,AI 能终结教育圈的造神运动吗?

文摘   2024-11-03 19:19   美国  

欢迎关注&星标,一起做AI原住民


 

「数学天才少女」「逆袭黑马」「打破名校垄断」...... 

 

这些耀眼的标签,是如何在一夜之间,被贴在一个16岁女孩身上的? 

 

2024年的阿里巴巴全球数学竞赛预选赛后,达摩院迫不及待地宣布了这个「励志故事」:一个来自江苏涟水中专的女孩,以第12名的成绩力压众多名校学子。媒体蜂拥而上,社交平台沸腾,人们欢呼着又一个「寒门出贵子」的佳话。 

 

然而,谁在意过,这簇突如其来的火焰,会不会太过炽热?当达摩院急于收割这场「励志风暴」的流量时,他们可曾想过,火光背后,藏着一个即将崩塌的谎言? 

 


一、事件反转:流量与真相的拉锯

 

当违规行为被揭露后,一切似乎都有了「完美」的解释:指导教师王某某违反比赛规则,提供了帮助。于是,一纸处分下达:取消教师评优资格,予以诫勉谈话。 

 

而当初那个急于宣传「励志故事」的达摩院,只是轻描淡写地承认「赛制不完善」、「管理不严谨」。 

 

这不是一个关于「天才少女作弊」或「教师违规指导」的简单故事。 

 

是谁在未经严格核实的情况下,就把一个预选赛成绩当作流量密码疯狂炒作? 


这把火,点燃了指导教师,或许还有女孩儿的贪欲。也点燃了人们对「寒门天才」的狂热追捧。 

 

当舆论的烈焰转向,最终受伤的,却是那个被推到风口浪尖的女孩和一线教师。 

 

他们的名字会做为这一波自媒体流量密码被一次次提起。 

 

二、教育评价的困境:考试如何做到真正公平。

 

作为一个学习爱好者,我从小总爱想每道考题背后的逻辑:为什么出题人会这样设置答案?什么样的题目才称得上好题目? 

 

这份执念最终引导我选择教育测试学作为研究生专业,毕竟之前都是自己瞎琢磨,希望通过系统学习,妄想找到设计公平有效考试的答案。 

 

然而研究生教材的第一页就给了我当头一棒


All tests are unreliable(所有的考试都不可靠)


我们能做的,只是追求相对的公平。 

 

教育测试学将这种相对公平化为两个核心指标: 

 

  • 信度(validity):考试是否真正衡量了应该测评的内容。比如,要测试学生的英语口语水平,却只考查语法和词汇,这就是典型的有效性缺失。

 

  • 效度(reliability):考试结果的一致性和可比性。就像托福考试,如果每月难度不一,那么不同月份考得的100分还具有可比性吗?

 

正是出于对这两个指标的追求,各大标准化考试都投入了海量资源进行题目研发和考试标准化。 

 

但考试公平不仅仅是试题本身的问题。以这次阿里巴巴全球数学竞赛为例,其规则设计本身无可厚非:虽然允许开卷查阅资料和使用编程软件,但明确禁止考生之间交流讨论。 

 

然而在执行层面,同校考生交流、师生「帮助」等现象似乎不稀奇。 

 

达摩院对这种情况视而不见,直到「励志故事」破灭才仓促应对,最终导致考试公平和信任崩塌。 

 

三、AI 时代的教育评价新范式

 

在人工智能快速发展的今天,我们完全可以突破传统教育评价的局限,建立更科学、更全面的教育评价体系。 

 

未来大学招生,公司招人,不该再完全依赖传统的标准化考试。这本身就容易诱发作弊行为。


我认为,未来所有评估或许应该是这样的:80% 的成绩来自日积月累的 AI 数据,20%来自传统考试。 

 

80% 的数据来自于平时。由AI 技术去追踪,搜集和分析一个人的学习轨迹。比如: 

 

知识获取: 你是如何理解新知识的?  

知识连接: 你如何将新知识与已有知识联系起来?  

问题解决: 遇到难题时,你会采取什么策略?  

知识运用: 你能如何活学活用,触类旁通?  

 

真正的人才,一定会在日常学习中留下痕迹。 

 

这些痕迹不是靠一次考试就能作假的。就像你的网购习惯会记录在电商平台里一样,未来的各类平台也能记录下你的每一次思考。 

 

AI 可以通过日常对话,去了解一个人的能力和潜力。它不会被一两次出色的表现蒙蔽,也不会被某个失误就否定一个人。 


这可不比传统考试的信度和效度高多了?

 

它记录的是你求知路上的每一次思考、探索与成长。它见证的是你学习旅程中的每一次突破与蜕变。它捕捉的不是孤立的成绩,而是你完整的求知轨迹。

 

在这样的体系下,作弊将失去意义。因为没有人能在长期的学习过程中一直伪装。就算偶尔有人侥幸蒙混过关,系统也能从整体数据中发现异常。 

 

最重要的是,这种方式更符合教育的本质。教育不是为了选拔,而是为了培养。当我们把目光从一次考试的得失,转向一个人的整体发展时,教育才会有机会回归本质。 

 

四、结语

 

这不仅仅是一个关于考试公平的故事,更是一个关于教育责任的警示。 

 

达摩院匆忙宣传,让一个16岁女孩过早暴露在公众视野之下。他们给了她「天才」的光环,却没有承担起应有的责任。当风波起时,他们只用一句「管理不严谨」就美美隐身。 

 

AI时代已经到来。技术进步给了我们机会,去创造一个更公平、更有温度的教育评价体系。 

 

在这个体系里,我们不再急于给任何人贴上标签,而是静静地观察他们的成长轨迹。 

 

让评价回归教育的本质,让评价是成长过程的忠实记录。 

 

这样,或许就不会再有下一个姜萍事件了。 




相关阅读
Claude 3.5 炸裂更新,自主操控电脑:人类凝视 AI 时,AI 也在凝视你
4个层次,1个方法:AI助你从信息碎片到深度思考
3个月成为 AI 魔法师,还是永远当个麻瓜?关键在这里

END


欢迎转发给你朋友圈的妈妈和教育工作者,一起培养在 AI 时代的原住民。

往期精彩回顾





1500 小时重度 AI 用户+企业 AI 培训师的全套 AI 工具箱(内有 AI 工作流)
我就是我,在柴房里的乡村小学毕业展,今年见过最感人的 AI 教育应用。




欢迎下载知识星球 APP,加入教育 AI 免费社群。

可以向我提问,深度链接我。

我也将持续分享我在教育 AI 领域的应用和个人成长感悟。 


10 万字「家庭教育 AI 手册」持续更新中……请移步合集页面📖✨



喜欢本文点个赞和在看
也欢迎关注下方公众号
文字|MQ  排版|带带弟弟公众号排版器



MQ的AI原住民计划
关注我。我是MQ老师,用AI重新定义教育,和孩子一起成长。
 最新文章