小理AI课堂丨AI的记忆之谜：从上下文窗口到长期记忆

科技 2024-10-23 17:31 美国

编者按

“小理AI课堂” 栏目将通过深入浅出的科普文章，带您深入了解AI在法律领域的应用，帮助您轻松掌握法律AI工具的使用技巧，提升工作效率。

让我们一起探索AI的无限可能！

在与ChatGPT等大语言模型进行对话时，大家是否曾经遇到过以下的情况：AI似乎总是更专注于近期的对话内容，而对较早的内容显得有些"模糊"？或者在长篇对话中，AI的回答有时会突然变得混乱？

这种"记忆"限制究竟是如何产生的？今天，让我们揭开AI记忆机制的神秘面纱，看看它们是如何“记住”与“遗忘”的。

理解AI的“记忆”机制

AI的"记忆"与人类的记忆有着本质的不同。人类的记忆是一个复杂的认知过程，而AI的"记忆"实际上是由一个被称为"上下文窗口"（Context Window）的机制来管理的，这就像是AI阅读文字时的“视野范围”。

在技术层面，上下文窗口实质上是Transformer架构中的注意力机制能够处理的序列长度。而当输入序列的长度增加时，计算资源的需求会呈平方级增长。这意味着当输入序列翻倍时，计算资源需求会增加四倍。这也解释了为什么不同模型的上下文窗口大小存在显著差异。比如，GPT-3.5的早期版本只能处理4K个token，而最新的Claude 3则可以处理超过200K个token。

在实际应用中，这种计算压力直接影响了模型的响应速度和效果。想象一下，当一个律师在处理一份复杂的合同时，需要AI同时考虑合同条款、相关法规和历史案例，这些信息加起来可能远超模型的上下文窗口限制。这就带来了一个关键问题：如何让AI在有限的"记忆"容量下更智能地处理信息？

Token：AI记忆的基本单位

在深入探讨记忆增强技术之前，我们需要理解Token这个概念。Token是AI处理文本的基本单位，它的切分方式会直接影响模型的理解和处理效率。现代语言模型普遍采用BPE（Byte-Pair Encoding）算法来进行Token切分，这是一个基于统计的编码过程。

举个简单的例子，当我们输入"人工智能"这个词时，模型可能会将其分解为多个Token。这种分解方式是基于海量训练数据中的词频统计来确定的。在实践中，我们经常会遇到一些看似简单的文本被分割成意想不到的Token序列的情况，这直接影响了上下文窗口的使用效率。

打破记忆的界限

面对上下文窗口的限制，以及Token使用效率的挑战，研究人员一直在探索如何让AI获得更强大的信息处理能力。

就像人类在记忆负荷较大时会借助笔记、参考书等外部工具一样，AI系统也需要一种机制来扩展其"记忆"容量。这种需求催生了一系列创新性的技术方案，其中最具代表性的就是检索增强生成（RAG）技术。

这项技术不仅帮助AI突破了原有的记忆界限，还为实现更智能的信息处理提供了新的可能。

RAG技术的原理与应用

为了突破上下文窗口的限制，研究人员开发了检索增强生成（RAG）技术。这项技术的核心思想是给AI配备一个"外部记忆库"，就像给人类配备了一个随时可查阅的笔记本。

在法律领域，这项技术展现出了特殊的价值。想象一个AI法律助手正在帮助分析一个复杂的案件，它可以实时检索相关的法规文件和历史判例，将这些信息与当前的分析结合起来，提供更全面的法律见解。

RAG技术的实现过程相当复杂，涉及多个关键步骤。

首先是文本的向量化，将文字转换为高维空间中的向量表示。这个过程通常使用预训练模型的编码器来完成，生成的向量能够捕捉文本的语义信息。接着，系统需要计算向量间的相似度，找出最相关的信息。最后，将检索到的信息与当前的查询进行智能融合，生成最终的回答。

记忆压缩：让AI更智能地遗忘

除了扩展外部记忆，另一个重要的研究方向是让AI更智能地管理有限的记忆空间。这就像人类在记笔记时会进行重点提炼一样，AI也需要学会"筛选"和"压缩"信息。研究人员开发了多种记忆压缩技术，包括层次化摘要和信息重要性评分等方法。

通过这些技术，AI系统能够保留最重要的信息，同时释放空间来处理新的输入。这在处理长文档时特别有用。例如，当处理一份长期合作协议时，AI可以提取出关键条款和核心义务，在保持对文档整体理解的同时，重点关注最相关的内容。

迈向真正的长期记忆

虽然上下文窗口的扩展和记忆压缩技术都在试图解决AI的"记忆"问题，但这些方案本质上还是在处理短期记忆。

那么，AI系统如何才能实现真正的长期记忆呢？目前，研究人员正在多个方向上探索这个问题。

持久化知识存储

最直观的长期记忆方案是建立持久化的知识存储系统。不同于简单的RAG技术，现代的持久化存储系统更注重知识的结构化组织和动态更新。

例如，一个AI助手在与用户的多次对话中，可以逐步建立起用户画像和偏好记录，这些信息会被系统化地存储并在未来的对话中持续发挥作用。这种机制适用于需要建立长期服务关系的场景，如个性化教育、医疗咨询等领域。

当然，持久化存储也带来了新的挑战：如何确保存储的信息真实可靠？如何处理可能过时的知识？如何在隐私保护和功能实现之间取得平衡？这些都是研究者们正在积极探索的问题。

渐进学习与知识更新

另一个重要的研究方向是让AI系统能够通过持续交互来积累和更新知识，这被称为渐进学习（Incremental Learning）。

传统的AI模型在训练完成后知识就基本固定了，但通过渐进学习，模型可以在保持原有能力的同时，逐步整合新的知识和经验。

打个比方，如果一个AI系统在处理法律文件时发现了一个新的判例解释方向，它不仅能够在当前任务中运用这个信息，还能将这个知识存储下来，在未来遇到类似案例时直接调用。这种能力将大大提升AI系统的实用性和适应性。

记忆的层次化管理

为了更好地模拟人类的记忆系统，研究人员提出了层次化的记忆管理架构。

这种架构通常包含三个层次：

1. 工作记忆：即传统的上下文窗口，用于处理即时的对话和任务。

2. 短期记忆池：存储近期的重要信息，可以快速调用但容量有限。这类似于人类记住最近处理过的几个案例或文档的情况。

3. 长期知识库：存储经过筛选和结构化的重要知识，这些知识可以被持续使用和更新。比如，AI系统可以将频繁使用的法律条款解释或常见的合同条款分析存储在这里。

这种层次化的设计允许AI系统更灵活地管理不同类型的信息，同时也能更好地模拟人类的认知过程。例如，当用户询问某个特定问题时，系统会首先检查工作记忆中的即时上下文，然后是短期记忆池中的相关信息，最后才会去查询长期知识库。

情境感知与记忆检索

在实现长期记忆的过程中，一个关键的挑战是如何在合适的时机调用正确的记忆。这就需要AI系统具备强大的情境感知能力。现代的解决方案通常结合了多种技术：

语义理解：深入理解用户询问的实际含义和背景
上下文追踪：持续跟踪对话的脉络和主题变化
关联分析：建立不同信息之间的逻辑联系

通过这些技术的结合，AI系统能够更智能地判断什么时候需要调用长期记忆中的哪些信息，从而提供更连贯、更有价值的回应。

未来展望：动态记忆管理

随着技术的发展，AI的记忆管理机制正在向着更智能、更灵活的方向演进。未来的AI系统可能会采用动态的上下文管理方式，能够根据任务的需求自动调整记忆的分配。研究人员正在探索多种创新方案，包括自适应上下文窗口、多级缓存机制等。

同时，混合记忆系统的概念也越来越受到关注。这种系统结合了多种技术，试图模仿人类记忆的层次性和灵活性。例如，将神经网络与符号系统结合，或者整合多模态的记忆网络，这些都是极具前景的研究方向。

结语

理解AI的记忆机制，不仅能帮助我们更好地利用这些工具，也让我们对人工智能的本质有更深的认识。

真正的智能不仅在于"记住"多少，更在于如何高效地运用这些"记忆"。随着记忆增强技术的不断发展，AI系统在处理复杂任务时的能力必将得到显著提升，为我们带来更智能、更实用的人工智能应用。

- END -

往期推荐：

小理AI课堂丨让人工智能更聪明的秘密：规模法则与涌现能力

小理AI课堂丨科普-模型也会骗人，什么是模型“幻觉”？

小理AI课堂丨Chain of Thought：揭开AI思维的链条

小理AI课堂丨专题分享：律师与AI协同的三种模式

小理AI课堂丨大语言模型进化道路的好帮手，简单认识“微调”与“RAG”

更多法律AI资讯，推荐关注↓↓↓

得理法律数据

用AI赋能法律，让法律普惠于民

最新文章

关于律师行业AI战略的若干思考

特朗普归来：如何重塑美国的AI蓝图

裁判观点第89期 | 一文速览本周最新发布5批典型案例及6条裁判要旨

人民法院案例库丨对幼儿园教师接受幼儿表达喜爱和敬意的小额零食行为的定性

福利来袭！教你如何免费体验得理VIP、SVIP会员权益

立法动态（第99期）| 降低外资投资门槛！六部门联合发文海关总署修改部分规章

美新闻集团起诉Perplexity打响“AI搜索第一案”；汤森路透推出“AI for Justice法律援助计划”丨法律科技简讯

近期法律热点丨网购仅退款19元遭商家起诉赔800；网络刷单超2亿涉非法经营罪！韶关6岁女童被泼开水，校园安全无小事

人民法院案例库丨新增20件案例裁判要旨（10月1日-10月31日）

十月新增法规精选 | 2024年10月得理法搜新增《城市公共交通条例》等文件

双11狂欢来袭丨得理法搜&得理律助限时特惠！

裁判观点第88期 | 一文速览本周最新发布5批典型案例及6条裁判要旨

法答网精选答问（第十批）丨民事诉讼法中“其他组织”与民法典中“非法人组织”是否同一概念？“非法人组织”是否具备诉讼主体资格？

小理AI课堂丨AI背后的老师：探索提示学习与人类反馈

首届深圳法博会盛大举行，得理科技以AI创新成果引领法律服务新范式

近期法律热点丨迪士尼扑克牌禁令遭起诉、员工发布负面言论被开除、救护车送错医院致病人死亡、暴力催收触及法律底线

最高人民法院发布人民法院实质化解行政争议典型案例（第一批）

新技术：法律科技重塑律所流程丨讲座分享

裁判观点第87期 | 一文速览本周最新发布4批典型案例及6条裁判要旨

人民法院案例库丨根据日常生活经验法则可以查明案件事实的，无需启动鉴定程序

小理AI课堂丨AI的记忆之谜：从上下文窗口到长期记忆

倒计时3天！你不可错过的法博会逛展攻略→

立法动态（第97期）| 新法新规10月起施行三部门联合印发《办理污染环境犯罪案件证据指引》

近期法律热点全览丨国企员工擅自离岗16年、长沙“4.29”自建房倒塌事故、议“东北雨姐”事件、消费者投放死虫碰瓷海底捞

三部门联合印发《办理污染环境犯罪案件证据指引》

首届深圳法律服务博览会即将开幕！得理科技诚邀你来打卡~

裁判观点第86期 | 一文速览本周最新发布7批典型案例及6条裁判要旨

人民法院案例库丨民间借贷中逾期利息和违约金、其他费用并存时，出借人能否一并主张？是否有司法保护上限？

立法动态（第96期）| 国家发改委等部门联合印发《国家数据标准体系建设指南》事关期货市场，国务院办公厅转发重磅文件

《通用大模型评测标准》发布；OpenAI新增“元提示”工具；Linklaters推出GenAI专家培训计划丨法律科技简讯

多部门重磅发布！流量扶持、融资支持、减负政策齐发力

律师行业新周期挑战下，如何通过定位战略实现突围

近期法律热点全览丨独子出走30年父母离世现身要遗产、AI模仿雷军骂人构成侵权、男子接亲被加要18万彩礼、无锡虹桥医院骗保事件

司法部、国家发改委公布《中华人民共和国民营经济促进法（草案征求意见稿）》向社会公开征求意见（附草案全文+说明）

国家发改委等部门联合印发《国家数据标准体系建设指南》

让人工智能更聪明的秘密：规模法则与涌现能力

立法动态（第95期）| 网络数据安全管理条例公布，明年起施行最高法发布民法典侵权责任编解释

裁判观点第85期 | 一文速览本周最新发布8批典型案例及6条裁判要旨

人民法院案例库丨新增13件案例裁判要旨（9月13日-9月30日）

得理科技CTO受邀参加百度云智大会，得理法律大模型受投资人争相追捧

一公司因虚假宣传法律AI服务而遭受指控；美国取消SB-1047法案；LexisNexis：AI在律所中的使用量剧增丨法律科技简讯

最高人民法院发布人民法院依法审理旅游纠纷典型案例

近期法律热点丨博主揭露民宿偷拍遭围堵、全楼验DNA寻找高空抛物肇事者、58页PPT举报管培生男友、小英卖惨营销塌房

最高人民法院发布涉产品质量典型案例

法律AI新篇章！得理科技官网产品全面升级，现已正式上线

裁判观点第84期 | 一文速览本周最新发布4批典型案例及6条裁判要旨

最高人民法院发布《关于适用〈中华人民共和国民法典〉侵权责任编的解释（一）》

最高人民法院答问《关于适用〈中华人民共和国民法典〉侵权责任编的解释（一）》

小理AI课堂丨科普-模型也会骗人，什么是模型“幻觉”？

“两高”联合发布依法严惩危害食用农产品安全犯罪典型案例

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉