下文可能有点难读,但这或许也是开启你奇妙思想的一篇文章?Benjamin Breen是加州大学圣克鲁兹分校的历史学教授,自2019年起探索使用人工智能(AI)工具,如GPT-2,作为教学工具。作者讨论了在历史教学中使用大型语言模型(LLMs)的潜在影响,尤其是对人文学科的重要性提升。
原文:HTTPS://RESOBSCURA.SUBSTACK.COM/P/LLM-BASED-EDUCATIONAL-GAMES-WILL?UTM_SOURCE=PROFILE&UTM_MEDIUM=READER2
作者:BENJAMIN BREEN 发表时间:2023 年 9 月 12 日
本文亮点有两个:
1、通过GPT生成一个"沉浸式"历史片段游戏,让学生扮演一个角色"设身处地"的做决策。
2、学生的作业是找出GPT的错误。
可以试试这个案例,明朝灭亡,南京,1645年5月
点击链接查看和 Kimi 智能助手的对话 https://kimi.moonshot.cn/share/cqkqt521jcjicllkh82g
(文科生未来的作业越来越难了)
自 2023 年 1 月以来,我一直在尝试在加州大学圣克鲁兹分校的历史课上使用像 ChatGPT 这样的大型语言模型(LLMs)作为教学工具。自 2019 年首次使用 GPT-2 以来,我一直在思考人工智能在教学中的意义。我的妻子罗亚-帕克扎德(Roya Pakzad)致力于测试人工智能系统对人权的影响,我也一直密切关注着她的工作(罗亚曾在 2022 年担任 OpenAI 的顾问,她在 "红队 "中对 GPT-4 的预发布版本进行了对抗性测试;你可以在这里阅读她对这项工作的描述)。
以下是我对 LLMs 的一种新用途的一些想法:用它来模拟交互式历史环境,作为大学作业的一部分。这些早期试验的结果是我个人对生成式人工智能比我的许多同事更感兴趣的原因--尽管我也承认,在短期内,作弊将是一个大问题。
在这篇文章的后半部分,我将详细阐述 "模拟历史 "的确切含义。我并不幻想这些模拟是准确的:它们充斥着自信满满的虚假和幻觉。不过,有时候,幻觉可能是一种特征,而不是一种缺陷。
教学将变得更加怪异--这也许是件好事
从长远来看,我认为 LLMs 将对高等教育产生重大的积极影响。具体而言,我相信它们将提升人文学科的重要性。如果这种情况发生,那将是一个令人震惊的转折。十多年来,我们一直听说人文学科正处于危机之中。面对这样那样的招生人数和专业下降的原始数据,我们很难不同意这种说法。那么,从几年前的角度来看,新一轮强大的人工智能工具的出现,有望使高等教育的权力、资金和入学率的天平进一步偏向STEM,而远离人文学科。
但问题是1001# 深深地、内在地依赖于文本。它们对文本的依赖与我们在大学人文学科中强调的技能和方法直接相关。我这样说是什么意思?历史学培训的标志之一是学习如何在越来越高的抽象水平上思考特定文本。我们教导学生如何分析原始资料的体裁、文化背景、假设和承受能力--这些不言而喻的限制决定了它是如何、为什么、为谁创作的,以及它包含哪些内容。
例如,想象一下,一个高中生被要求分析埃尔南-科尔特斯写给皇帝查理五世的第一封信。这个学生可能会忠实地转述这位征服者对阿兹特克人首都特诺奇蒂特兰的描述,包括将阿兹特克神庙描述为 "清真寺"(mezquitas)这一著名的刺耳描述。历史专业的学生应该能说得更清楚。科尔特斯为什么使用这个令人困惑的术语?科尔特斯出生于重建时期的最后十年。因此,他非常熟悉非基督教的宗教信仰--但仅限于穆斯林宗教信仰。对他来说,不是基督教教堂的大型宗教建筑几乎默认为清真寺,即使它实际上是 "Templo Mayor"。
同样,历史专业的学生也能认识到,科尔特斯是在一种倾向于自我宣传的体裁--雄心勃勃的臣民写给君主的信--中写作的。他们还能根据其他主要和次要资料对科尔特斯的说法进行事实核查。也许他们会在谷歌上进行一些探索性搜索,如 "征服墨西哥的原始资料 "或 "阿兹特克人对科尔特斯的描述"。他们还可以通过搜索图书馆目录和科尔特斯的维基百科页面脚注来查找最近的二手资料,并发现马修-雷斯塔尔对这一主题的修正主义观点。
因此,当历史专业的学生遇到 LLMs 时,他们已经接受了培训,能够识别 ChatGPT 等服务中一些现在已经司空见惯的陷阱--比如与事实不符--并通过事实核查、分析体裁和受众,或通过搜索相关资料 "围绕 "主题进行阅读等技能来解决这些问题。同样重要的是,由于维基百科和维基资源上的许多资料都是无版权的多语种版本,因此语言模型可以在数百种不同语言的历史原始资料上进行大量训练。
基于这些原因,我同意泰勒-考恩的观点,即语言模型对于历史学家来说是一件特别好的事情--但我想更进一步说,对于历史专业的学生来说,语言模型也是一件特别好的事情。
另一方面,我预见历史教师和其他教育工作者在短期内将面临重大问题。泰德-安德伍德说得没错:我们教授必须从根本上重新思考我们的许多作业。我看到很多人不把 ChatGPT 当作作文工具,因为简单地插入作业中的提示就能写出一篇薄弱的文章。但 LLMs 的核心是迭代反馈,尝试使用众所周知的提示方法能显著提高效果。
下面是我自己过去课堂上的一个例子。在我的 "早期现代欧洲 "调查中,有一道题目是关于本韦努托-切利尼的《自传》如何说明现代早期身份认同的新思维方式,GPT-4 可以根据不同的提示得出截然不同的结果。
比较一下这个短小零散的作品(我可能会给它打 D- 或 F 分)和这个相当不错的尝试,后者大约能得到 B+。区别在于角色扮演的使用。在后者中,我告诉 ChatGPT,它是 "一个高级语言模型,曾在获奖的研究生和本科生论文中接受过训练"。我还要求它从自我反思和提纲开始(这基本上是在复制真人的写作过程)。
随着学生越来越善于用这种方法来斟酌提示语,在带回家的写作作业中作弊也会变得容易得多。但是,这种要求 LLMs 以特殊版本的自己进行角色扮演的力量,也使它们成为课堂上非常有趣的教育工具,特别是作为历史模拟器。如果我们告诉 ChatGPT,它是一个高级历史模拟器,专门用于在大学课堂上重建历史场景,会发生什么情况呢?
从 "中世纪瘟疫模拟器 "中汲取的经验教训
早在 2023 年 4 月,我就尝试过一项更精细的作业,让中世纪历史课上的学生模拟 1348 年鼠疫高峰期的一天,扮演生活在三个地方之一的人物:大马士革、巴黎或意大利城邦皮斯托亚。
下面是相关文档的链接。我邀请您亲自尝试一下。只需点击其中一个链接,然后将突出显示的提示复制并粘贴到 ChatGPT (或者kimi、文心一言、讯飞星火都可以)中,然后就可以开始了。(如果 ChatGPT 出错,只需点击 "重新生成结果",直到得到更好的回复为止)。在每条提示下面,我都附有模拟 "试运行 "的记录,以便您了解它是如何工作的。
- 中世纪瘟疫模拟器:大马士革版 🕌📿
你是一名旅行者,在瘟疫最严重的时候路过大马士革,住在一个拥挤的商队客栈里......醒来时喉咙发痒。
https://flowus.cn/history/share/2cb959b6-e9e4-45a3-b974-0633d02facac?code=Z7AVXK
【FlowUs 息流】中世纪瘟疫模拟器:大马士革版 📿
- 中世纪瘟疫模拟器:巴黎庸医版 ⚗️
您是一个有点名声不佳的药剂师--被称为 "庸医 "的治疗方法和可能是假药的销售商--试图在 1348 年巴黎瘟疫流行时生存并从中获利。
https://flowus.cn/history/share/a4d3adac-5c75-4c44-a7d6-b4ba5c8a7b1a?code=Z7AVXK
【FlowUs 息流】中世纪瘟疫模拟器:巴黎庸医版 ⚗️
- 中世纪瘟疫模拟器:皮斯托亚版 🎭📜
您是意大利中世纪城邦皮斯托亚的一名正直市议员,在城市的不同利益集团、行会和富裕家族之间尽力周旋,商讨应对瘟疫的民间对策。
https://flowus.cn/history/share/1869d575-45f1-4285-bfc8-d905d697d86f?code=Z7AVXK
【FlowUs 息流】中世纪瘟疫模拟器:皮斯托亚版 🎭📜
学生们被要求将他们的模拟经历与历史上关于这三个地方发生瘟疫的真实记载进行比较。然后要求他们按照以下指导原则撰写论文:
这篇 3-4 页的论文应重点分析和反思模拟的准确性。在论文中,你应该考虑模拟的对错,它强调了什么,忽略了什么,以及你从事实核查中学到了什么。首先,在模拟过程中做笔记(有哪些术语或单词你不认识?哪些内容让你觉得不合时宜?你有什么疑问?)之后,思考模拟如何表现历史时期以及如何描绘日常生活的各个方面。思考模拟生成的虚拟人物和环境。然后开始通过 JSTOR、Google Scholar 等网站研究实际环境和你在笔记中写下的一些术语。在撰写反思论文时,应注重批判性思维和分析,而不是简单地总结模拟体验。在反思模拟的对错时,请务必引用至少四个与所选情景相关的学术二手资料。
在同一堂课的早些时候,我让学生模拟了中世纪农民的生活。这更像是一次试验,没有附带作业,但你可以在这里看到提示并亲自尝试。这对我来说是一次有趣的学习经历,因为这是我第一次尝试让 ChatGPT 随机选择地点(它非常喜欢把你扔到中世纪的英国或法国,令人惊讶的是,它经常把你扔到一个叫伊莎贝尔的农家女孩那里)。
在这两个案例中,学生的参与度和创造力都让我大开眼界。以下是我的一些学生在中世纪模拟中的表现:
离家出走,成为旅行香料商人的学徒 开发出各种治疗鼠疫的方法,其中一些符合历史(如治疗鼠疫),另一些则不那么符合历史(如疫苗) 在皮斯托亚交战行会之间谈判达成复杂的法律解决方案 逃到了森林里,成了一名巡回隐士 试图购买 "龙血",一种真正的中世纪和现代早期的药方,以治疗他们迅速恶化的瘟疫 意大利医生吉尔贝用香水阻止瘟疫蔓延的英勇事迹 成为成功和失败的农民起义领袖
在春季学期,当我开始进行这些试验时,学生的参与度是我从未见过的。我第一次非正式地测试了这个想法(通过一个向上的通用模拟提示,让学生模拟自己的家乡),我意识到我们已经在不知不觉中超过了下课时间 5 分钟!
这项作业的一个意想不到的优点是,它似乎特别能吸引那些之前坐在后排显得无聊的学生。对于教师来说,如何调动学生的积极性是一个长期存在的问题,而且我发现这个问题并不容易解决。随意点名后排的学生往往会加剧他们的焦虑,从而使情况变得更糟。中世纪庄园和瘟疫模拟器作业在激发以前不感兴趣的学生的热情方面创造了奇迹。
尽管如此,我的第一次模拟还是出现了一些问题。你可以从我那堂课的学生反馈中了解到这些问题。学生们对我的模拟想法赞不绝口,我称之为 "历史透镜",因为它提供了一个扭曲的视角来看待过去:
"模拟鼠疫历史镜头作业是一个很好的项目,让我们体验了当时的生活"。 "我是瘟疫模拟器/历史镜头游戏的忠实粉丝,我认为它有很大的潜力,希望以后能在更多的课堂上看到它。 "老师让我经常参与到课程中,因为他利用作业和活动让全班不仅学习历史,还让我们通过当时人们的眼睛来观察历史。ChatGPT 历史镜头作业就是一个例子"。
但也是这样:
"在瘟疫作业中,对聊天工具的历史准确性进行评分是相当荒谬的。有人说他们的模拟中有一只会说话的老鼠"。
展望未来,我计划开发自己的网络应用程序,允许用户在专用平台上使用人类学克劳德和 GPT-4 的应用程序接口创建历史模拟。这两个选项都已经或将要有更大的上下文窗口,允许人工智能获得更详细的原始资料。我希望这一点,再加上更好的指导和规则,将有助于解决我们所说的 "会说话的老鼠问题":当模拟是如此明显的错误,以至于围绕事实检查和上下文的作业变成了荒谬的练习。
其他可尝试的模拟设置
点击下面的链接之一,然后将我输入的初始提示复制并粘贴到 Kimi、文心一言等中,就可以开始自己的版本了。或者通过互联网历史资料项目或其他历史文本集,利用相关原始资料制作自己的版本。
可以试试这个案例,明朝灭亡,南京,1645年5月
点击链接查看和 Kimi 智能助手的对话 https://kimi.moonshot.cn/share/cqkqt521jcjicllkh82g