再谈AI教育创新:阻拦进步的,不是AI | 义柏伙伴

文摘   2024-09-12 14:00   北京  

本文作者:教育AI公司“知智教育”创始人/CEO李卓。

公司正在进行融资,对于AI在教育的思考与创新有所好奇的投资人、同道者,欢迎文末添加作者微信深入交流。

图源:Unsplash

基于Scaling Law的大模型技术,对于现存教育体系的影响,是绝对颠覆性的吗?


从学理上来讲,是的。按照布鲁姆的“教育金字塔理论”,人的学习有两个特点:


1.人不可能跨越金字塔一层二层的“记忆”和“理解”能力,而直接实现“知识分析”“知识创造”的能力;

2.但任意一个LLM大模型,在学了人类几乎所有的文字语料后,至少在文字语言的“记忆”和“理解”和“分析”能力,全面超越人类。


基于这样的背景,我们必须要问,当人类社会的知识体系,被模型组织和应用后,人是否还有必要去背单词、理解唐诗宋词、熟记数学公式——我们到底为了什么去学习?



从实践来讲,讲AI对教育的颠覆为时过早:


1. 从2023年GPT3.5发布以来,还未有一款基于模型的教育AI产品,被普遍应用;(百万DAU或许是一有效milestone)

2. 即使是上一代应用最为成熟,快手抖音背后的“音视频识别/个性化推荐算法”,虽然全面改造了电商、娱乐和游戏行业,至今在教育产品上从未应用。


如果我们的把视野放宽,把时间拉长,会发现,技术总会对教育产生颠覆性的影响,但不是以我们意想的方式。


01

历史上,技术是如何对教育产生影响的?


第一次工业革命的出现,绝不只是突破了马尔萨斯陷阱,让人口和收入实现了飞升。更大的价值是,欧洲首次出现了“平民教育”。


对于中国人来讲,科举制早在1000年前,奠定了平民参与教育体系的必要性和通道,平民教育并不特殊。厉以宁老师在《资本主义的起源》的论述中,科举制正是中国文化不断、文明持续的“柔性体系”的保证。


但对于西欧人来讲,平民大范围参与教育,到19世纪才有雏形。


原因在于,“工厂制”的出现,使得纺纱机、蒸汽机的应用,需要大量会识字、懂算数的产业工人,那个年代真正的资本为了劳动产出的增加,有动力投资平民教育。早期多以夜校的方式出现。


还需要提及的是,工厂制的出现和“圈地运动”的双重冲击,刺激了早期城市化的发展。移民的聚集、城市扩张与学校增加(资源投入与收益投入产出比的原因),从来是相伴相生。至今仍是中国多数县乡地区,城乡移民、房地产扩张的主脉络。



而到了第二次工业革命时期,以福特汽车为代表,流水线与标准化工厂的出现,以及相伴生的“泰勒式管理”则奠定了我们对于现代教育体系的理解。


工人拥有一定专业知识、适应集体化生活、对于指令的敏感与执行的效率,是现代工厂大规模生产的基础。而与此配套,则是我们再熟悉不过的“普鲁士教育体系”:


1. 义务教育普及:初级教育向所有国民免费开放,这并非单纯的福利,而是一种对人力资本的投资,旨在为各行各业培育大量具备基本文化知识与技术水准的产业工人。


2. 教师专业化:担任教职的老师必须先接受专业院校培训,培训合格后由国家给付薪水,将老师转变为 “公务员”。


3. 教育评价考核严格:我们最为熟悉的“高考”。采用专门的考核机制来保证教学质量,比如制定教学大纲、进行统一考试等。通过这些方式,保证学生能够掌握既定的知识和技能,尽量减少教学过程中的不确定性和水平波动,确保学生在知识和品德上成为 “合格” 的产品。


4. 课程标准化与学科划分明确:按年龄将学生划分为不同年级,把知识划分成各个学科,并进一步将学科分为各个独立的单元。例如,采用 “课时” 概念,每节课40分钟左右学习其中一个独立单元,课后休息十分钟后,再学习另一门学科的独立单元。


5. 强调纪律与服从:该教育体系过度强调纪律、服从、从众、等级,军训、广播体操、星期一列队升国旗,都是这一体系的延伸。


6. 注重实用性:教育目标紧密围绕国家工业化的需求,着重培养学生在科学、数学、现代语言等实用学科方面的能力,以满足工业发展对各类专业人才的需求。



本文读者大约 99% 都是这一体系培养出来的人才,因此不再赘述。


只是,当我们老生常谈教育体系改革时,有必要分析教育体系,以及它所倚赖的经济模式与社会阶段。我们甚至可以大胆预判,在中国依然保持“世界工厂”定位的时候,中高考制度、超级中学、分科教学的始终会伴随多数国人的教育生涯。


或许还会有人用华为模式、字节模式证明中国已不止是“工业制造业大国”。但要知道,传统信息技术产业中,基于经典规则的程序(“If…Then…Else”),应被理解为局部自动化的专用技术,适用于高频次重复任务。一旦超出限定规则外的应用场景,则需要重新把环境进行要素拆解与工程模拟,由此产生新的边际成本。


中国“学好数理化,走遍天下都不怕”的普鲁士教育体系,以及其形成的工程师密度与工资洼地,是支撑以上信息厂商的基本架构。


普鲁士教育体系也并非毫无松动,当创业之火在硅谷燃烧,点燃全球信息革命时。熊皮特的“企业家模型”为社会提供了新的人才培养目标:


  • 创新能力:熊彼特指出,创新就是建立一种新的生产函数,把一种从来没有过的,生产要素和生产条件的 “新组合” 引入生产体系。企业家通过创新打破经济的 “循环流转” 均衡状态,实现 “创造性的破坏”,推动经济结构从内部进行革命性的破坏。

  • 组织能力:企业家不仅要能找到或创造新的事物,还要善于动员和组织社会资源,进行并实现生产要素新组合,也就是具备 “利用资本的经营能力”。

  • 承担风险的能力:企业家需要有勇气和决心承担这些风险,并且在面对风险时能够保持冷静,采取有效的应对措施。


作为对于“企业家”人才模型的回应,皮亚杰的“建构主义”与西蒙斯的“联通主义”则在教育学的基础上提供了新的可能性,行文有限,相关理论不再一一赘述。只是我们如今习以为常的对于美好的教育追求,如个性化发展、独立人格、创新意识等教育目标,由此才有了逻辑化的表述与实践路径的获得。



综上,如果我们以百年记,技术对于教育的改变,总还是要引入经济学的视角,无论是组织行为学也好,技术创新也好,技术对教育的传导作用,首先需要以经济范式转移为前提


但需要强调的是,正如萝卜快跑激起了对于司机的劳动力替代的社会情绪,每一次技术革新带来的,无不遵循经济学经典的“价格理论”而延伸:


  • 成本驱动:在市场经济中,企业追求利润最大化。新技术出现时,如果机器以较之于人力资产更低的成本,生产出相同或类似的产品或服务,企业就有动力采用这种新技术来替代旧技术。

  • 价格竞争:成本的降低反映在产品价格上。一家企业采用了新技术,在市场上以更低的价格销售产品或服务,从而获得竞争优势。其他企业为了在竞争中生存,也会被迫采用同样的技术或者寻找其他更先进的技术进行替代。而被这一竞争飞轮技术替代卷出的劳动力,则成为时代的牺牲品。


由此,如果技术创新产生的劳动力替代,无法在教育实践上得到回应。教育系统依然以惯性,不断产出早已被技术替代的人力劳动价值,“技术性失业”则会成为时代隐疾。


02

雪上加霜:为什么信息革命,没有改变我们的教育模式?


2011年初,乔布斯在一次与比尔盖茨会面时,他提出了 “乔布斯之问”:“为什么计算机改变了几乎所有领域,却唯独对学校教育的影响小得令人吃惊?” (几个月后,乔布斯辞世)


或许乔布斯当时无法预见,之后由他影响的移动互联网对于人类衣食住行的深刻影响,也不曾想到一年后Image.net一举封神Geoffrey Hinton,“神经网络算法”成为AI新一代浪潮的共识。


只是,当我们站在2024年的此时,却发现 “乔布斯之问”或许可以拓写,却依然振聋发聩:“为什么移动互联网和AI几乎改变了所有领域,却唯独对学校教育的影响小得令人吃惊?” 



作为教育科技的从业者,或许从后视镜的眼光,复盘过去十年教育科技的探索,虽各有千秋,但始终难实现“学练考评测”的有效循环:


  • 拍照搜题,并没有成为孩子自我反思、理解习题讲义的工具,反倒成为“抄作业”利器。某拍照搜题APP巅峰时期日活过亿,但出海时期随早期也是一鸣惊人,最近确实逐步下滑,大约是中国孩子与国外孩子,面对“写作业”时,压力的区别。

  • 录播课,还没有实现真正的普惠教育。反倒成为对于孩子注意力持续的考验;这也是多数录播课的续报率不足60%的原因。

  • 直播课,有效互动自然好,只是双师大班万人大课的互动,自然难以有效。双师大班续保率,平均比线下小班低10%-20%,原因莫不如此。

  • AI题库,并没有帮助孩子形成学习习惯,刷题与知识理解之间的鸿沟,仍难以填充。

  • AI助教答疑,2023年由Khanmigo首先推出,国内不少产品跟进。但从实际落地来看,国内类似产品次留不超过10%,人均问答次数<2,也符合教育者的基本判断。毕竟,从题目到定位知识点,精准问出哪里不会,对于绝大多数孩子来说,都不现实。

  • AI学习机的出现,再一次证明了教育行业离“云计算”时代尚有距离。离线终端无法对孩子的行为数据进行回传,机器学习也就没有了前提。


更为核心的原因,在于以上所有产品的预设,都是一个学霸型学生,他积极好学、意志坚定、敏思好问,有了这些工具自然学习事半功倍。但环顾四周,又有几个孩子真正达到这种学霸水平呢?



但不能说从业者没有付出过努力。中国教育财政中,近年在“教育信息化”的年均投入已达3000亿。即使在中国西部地区考察,也会惊讶地发现,多数乡村学校的教室,都装上了造价不菲的一体化大屏。


而在教育培训市场,笔者则亲眼见证好未来在“教育让科技更美好”上的反复求索。其每年在技术创新上的投入,足以让多数服务行业上市公司惊讶。


只是,作为家长或学生,实际体感上,教育领域的科技应用,场景依然少得可怜。为什么?


问题或许不是技术本身,而是教育领域,人与技术的协同机制还未有效建立


回到普鲁士教育体系,其最大的特征,就是专业化、职能化、标准化的现代性特征,由此延伸出一套复杂而缜密的教学行动体系。


我们以“备课”这一场景为例,下图展示了不同机构,老师在作业设计的的其中两步。虽方法有所不同,但无不遵循着较为统一的步骤与标准动作。



而在“备课”之外,还有“教研”“教学”“作业布置与批阅”“考试与测验”“家长沟通”“学生管理”“教务管理”等不同场景与标准化动作,无论是校内校外,这一体系的运转复杂度与精密度,都要超越绝大多数制造、消费行业。


任何技术在教育的领域的落地,都需要全方位考虑。技术在整体教学流程上的改造,学生端、家长端、学校端、教师端密切相关而难以分离。


过去二十余年,教育科技的从业者前仆后继,教育数字化系统都有所探索,产品交互虽未完全统一,但多有实践。吊诡的是,技术的进步却在此时戛然而止。


核心卡点在于,技术如何落实到人。以老师举例:


在老师授课的准备中,无论是课上插入一段视频,还是能通过课堂的学生反馈数据进行迭代,其对整体授课流程、授课节奏、授课内容的调整,都是牵一发而动全身,且效果不确定。这自然使绝大多数教师工作者与管理者,虽在技术理念上都有好奇,但系统化改造原有教学流程,其成本之高、投入产出的不确定,都难以有效落地。


而从学生视角看来,从“元认知”角度,虽然多数教师都期待每个孩子能根据学情数据,掌握“制定自己的学习计划、关注计划进展、复盘学习成绩、不断迭代计划”的能力。


但如果站在数据角度看,一个孩子的学情数据包含了其课堂行为数据(如举手次数、回答问题的质量、按时到课)、成绩数据(作业及测验数据)、素养数据(协同能力、表达能力)等等。面对这些数据分析的难度,甚至不亚于一个互联网公司初级分析师面对的数据量。


显然,这样的数字化并非一朝一夕之功。


总结来看,学生是一个完整的个体,学业成绩、社会竞争与心理成长,几乎每一位中国孩子都是在这一复杂三角关系中左右迁移。而与此配套的教学体系与教师教研群体,其动员难度之大、程度之深、惯性之强,都会让创新与迭代的成本远高于现有体系运转的成本。


拉枯摧朽席卷人们衣食住行的信息技术创新,或该就此止步吗?


03

AI改变教育,或许需要“教师”的退场


从逻辑推断,如果信息技术难以落地教育场景的卡点,在于教师与技术协同。那么,如果在学生学习中,去掉教师的角色,且能保证学习效果,是否是一种解决方案?


从以往“内容消费与分发”的行业迭代中,这一方案或许可行。笔者经历了过去二十年从纸质报刊,到门户资讯,再到算法客户端的完整历程。2018年加入快手时,笔者最为惊讶的不是其社区生态的活跃、收入的规模,而是推荐算法对于每一位用户内容消费偏好的理解,远超越于其家人与朋友,这正是短视频直播平台的DAU、停留时长远超其他客户端的原因。作为短视频的消费者,多数读者应有同感。


“机器”比“人”更了解人的偏好,主要得益于“神经网络算法”在短视频领域的应用:


  • 音视频识别:依靠CNN等神经网络技术,算法对于一条短视频的定义数,达到千亿级别特征,远超人类对于一个视频的描述和认知;

  • 用户特征提取:通过特征工程,算法对于人消费行为的特征提取,超过万亿级别;

  • 推荐技术:借助以上内容与用户的颗粒度,其算法推荐与内容匹配的精准度,自然超越了多数人力范围。


或许我们可以说,作为移动互联网为数不多的共识,个性化推荐算法已经实证,“算法更懂人”


快手离线强化学习算法示意


在这一前提下,作为上一代AI的推荐算法,可以在调整后,更懂用户的学习行为。那给学生推荐什么内容,从而促进学生发展,则是更为重要的问题。


LLM大模型提供了新的可能性,从教育工作者的视角来看,大模型具备以下特征:


  • 知识的全知全能:学习了人类所有文字语言,且具备推理与涌现能力,我们可以说,大模型具备了一个远超教师知识的系统能力。

  • 无限生成与随时随地:如果我们把顶级名师作为一种教育系统的稀缺供给,而针对每一名学生,进行名师同一水平的个性化学习(针对性的情绪照顾、知识讲解与风格适配),在以往难以想象。但在模型现有的能力下,则具备可能性。

  • 模型作为硅基“生命”的特质:比起作为“碳基生命”的教师,不可避免有教学水平的差异、教学状态的起伏。而作为“硅基生命”在标准化的教学服务上,其稳定性与持续性要超越真人教师。换句话说,作为管理者的学校与监护者的家长,在可控的教育模型下,无需担心孩子接触接受的教育质量的稳定性和规模化服务的能力。


只是,从逻辑可行到真正的教育实践,仍需要解决好以下几个问题:


  • 如何让模型能力达到名师水平:因模型生成内容的质量与精准度,取决于其prompt质量,prompt工程成为在教育场景落地的首要前提。只是过去以往有效的教研教学方式,如何通过prompt实现,既需要教研教学专家,还需要其具备技术能力。

  • 畅想个性化学习,但知晓个性是前提:如上文所讲,在快手抖音的内容消费领域,理解用户行为特征与个性已经实现。然而,教育领域的行为特征提取与定义,仍需要发展心理学、教育评价、教学法等系统方法做支持。由此,才可能有关于学生的“个性化特征提取”,才有依靠模型进行个性化生成的可能。大模型的因材施教,需要先了解“材”的特征。

  • AI时代,我们给孩子什么样的交互界面:正如微软与苹果通过“图形化交互界面”定义了PC电脑的应用、“信息流”定义了移动互联网的应用,AI 时代,我们需要什么样的交互界面?而什么样的交互界面,能让孩子在没有教师参与的情况下,持续去学习?

  • 商业价值在哪里:市场永远是创新扩散、体验提升的最好路径。但要回到市场逻辑,家长对个性化学习买单的心理是什么?正如上文所述,普鲁士教育体系的“人才选拔”机制仍贯穿于中高考的逻辑,及东亚社会的科举传统,让东亚家庭的教育投资,很难避开“社会竞争”的本质目的。



最后,作为一个教育工作者,仍需反复强调,学习≠成长≠教育


内化于现代知识竞争的学习体系,从知识获取、逻辑发展、脑区开发等等,自有其逻辑。而学习远不是孩子成长的全部,同理心、沟通与表达、爱与感受的能力获得,虽与知识学习有所交叉,但更取决于孩子的成长环境与家庭关爱。


本文所讨论的内容仅限于标准化知识的“学习”范畴。一个孩子成长的天地,依然千里之广、浩瀚之远,这是一个成年人面对孩子时,该有的谦卑。



本文作者系教育AI公司“知智教育”创始人/CEO李卓。对于AI在教育的思考与创新,有所好奇的投资人、同道者,欢迎添加作者微信深入交流。




# 部分交易案例 #

义柏资本
中国产业科技化的生态枢纽,科技创新引领者的首选伙伴
 最新文章