首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

从预测下一个词到有目的对话：LLM聊天机器人的进化之路

旅行科技 2024-09-16 00:01 北京

ChatGPT、Claude这些AI聊天机器人真的那么聪明吗？

它们真的能理解我们的意图，并与我们进行有意义的对话吗？

最近，各大AI公司都在疯狂炫耀自家大模型的新成绩:

MMLU、HumanEval、MATH...这些benchmark的分数一个比一个高。

Table of the pretraining data mixture from llama technical report

但是，你有没有发现，这些分数的提升，似乎并没有让我们的使用体验变得更好？

尤其是在进行多轮对话的时候，这些所谓的"超级AI"经常会忘记自己是谁，忘记你给它的指令，甚至开始胡言乱语。

这到底是怎么回事？

今天我们就来聊聊LLM聊天机器人的进化之路，看看它们还缺了点啥。

从"餐厅脚本"到"预测下一个词"

要理解现代LLM聊天机器人的问题，我们得先回顾一下对话系统的发展历程。

早在1970年代，Roger Schank就提出了著名的"餐厅脚本"。这个脚本将餐厅就餐的整个过程分解成进入、点餐、用餐、付款等步骤，每个步骤都有预设的对话内容。

The context window of a chatbot

这种方法虽然简单，但在特定场景下还是能模拟出比较真实的对话。

后来又出现了ELIZA(模拟心理治疗师)和PARRY(模拟偏执症患者)这样的系统，它们都是基于规则和模板的对话系统。

而现在的LLM聊天机器人呢？

它们的核心其实就是一个 "预测下一个词"的大型语言模型。

没错，就是那个在海量互联网文本上训练出来的，能够流畅续写的模型。

但是，预测下一个词和进行有意义的对话，这两者之间是不是差了点什么？

LLM聊天机器人: 华丽的外表下藏着"失忆症"

现代LLM聊天机器人的构建过程大致如下:

预训练:在海量文本上训练一个预测下一个词的模型
引入对话格式:使用特定的格式来表示系统提示和对话历史
RLHF:通过人类反馈来微调模型，使其更"听话"

Yann Lecun Slide 中的图片

这个过程看起来很美好，但实际上存在一些根本性的问题。

最大的问题就是: 这些模型在多轮对话中很容易"失忆"。

研究人员发现，即使是最先进的LLM，在经过几轮对话后，也会开始忽视系统提示，偏离原本的角色设定。

Instruction stability on LLaMA2-chat-70B and gpt-3.5-turbo-16k

上图显示，LLaMA2-chat-70B和GPT-3.5-turbo-16k在多轮对话中的指令稳定性都在迅速下降。

这意味着什么？

意味着你辛辛苦苦写的那些精妙提示词，可能在几轮对话后就被AI忘得一干二净了!

更可怕的是，这可能会带来安全隐患。

当AI忘记了那些规定安全行为的系统提示，它就更容易被"越狱"，产生不当言论。

缺失的一环: 目标导向的对话能力

那么，到底是哪里出了问题？

答案是: 现有的LLM聊天机器人缺乏目标导向的对话能力。

人类的对话通常是有目的的。我们聊天不是为了预测下一个词，而是为了达成某个目标，比如:

规划旅行
解决问题
达成共识
...

但是，现有的LLM训练方法并没有考虑到这一点。它们只是在尽可能自然地生成下一句话，而不是朝着特定目标前进。

这就好比你雇了一个助理，他说话很流畅，知识面很广，但就是不知道你要他干什么。

未来之路: Purposeful Dialogue

为了解决这个问题，研究人员提出了"purposeful dialogue"(有目的的对话)的概念。

这种方法试图让AI在对话中保持长期目标，而不是仅仅关注下一句话。

A sketch of Dialogue Action Tokens (DAT)

比如，有研究人员提出了一种叫做"Dialogue Action Tokens"(DAT)的技术。这种技术在每轮对话中都会使用一个"规划器"来预测一些前缀token，从而控制生成过程。

通过这种方式，AI就能在多轮对话中保持一致性，朝着特定目标前进。

这听起来是不是很酷？

但是，要真正实现这一点，还有很长的路要走。我们需要:

更好的对话系统监控和控制技术
更好地利用离线奖励信号
更深入地研究多轮对话作为潜在攻击面的安全问题

Sketch of the process of measuring instruction stability

进化之路任重道远

从"餐厅脚本"到"预测下一个词"，再到未来的"有目的对话"，LLM聊天机器人的进化之路充满挑战。

但是，这条路必须走下去。

因为只有真正具备目标导向的对话能力，AI才能成为我们的得力助手，而不仅仅是一个会说话的大词典。

你觉得未来的AI助手会是什么样子呢？

👇

👇

👇

👇

本文同步自于知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本。
每天挖掘出10+ 热门的/新的 github 开源 AI 项目
每天转译、点评 10+ 热门 arxiv AI 前沿论文

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

👇👇👇快人一步，掌控AI👇👇👇

http://mp.weixin.qq.com/s?__biz=MzA4NzgzMjA4MQ==&mid=2453449929&idx=2&sn=249ffe95daa39294925905d3d79e2374

关注AGI 的沿途风景！

最新文章

来了！ChatGPT 推出桌面级编程助手！

Anthropic推出Claude 智能改进器，「一键优化」你的AI提示词！

谍战！OpenAI 派飞机侦查马斯克xAI 超算中心

重磅！OpenAI「Operator」明年一月发布！

LeCun被指剽窃！Marcus怒斥：我要告你！

重磅！马斯克或将影响特朗普新政府的AI监管政策

Hinton：别学AI，去当水管工吧！

软体机器人的「超级肌肉」来了：力举千倍重物，柔软如肌肤

Ilya Sutskever：预训练已到瓶颈！

Sam Altman的Worldcoin：用眼睛换币，84%人亏损！

重磅！OpenAI前CTO Murati新团队初具规模！挖角OpenAI成功？

独家解密！Lex Fridman与Anthropic CEO 5小时长谈：Claude 4.0、AGI 2026年或将到来！

再见GPT！你好，「o」！

重磅！AlphaFold 3 终于开源了！

AGI 何时到来？Sam Altman、Dario Amodei、Geoffrey Hinton、Yann LeCun 的时间表

MobA：让AI 真正学会使用手机！

大模型进入瓶颈期，Gary Marcus：我赢了！

OpenAI 新模型Orion 或难产！

Sora 两周内发布！

狂飙！ChatGPT跃升至全球第八大网站！

SpaceX「火星互联网」计划曝光：每秒千万亿比特的星际通信！

惊人发现：LLM模型一半的注意力层是多余的！

重磅！OpenAI迎版权诉讼重大胜利！

Stack Overflow 2024 调查报告出炉：Python将统治编程世界！

重磅！亚马逊欲增资Anthropic：条件是使用自家芯片！

Sam Altman：千日内迎来超级AI，人类将步入丰裕时代

如何使用纯GPT-2解码器进行OCR？

AI艺术之超现实水果！

谷歌研究员François Chollet：AI并非真正的智能，而是一种高级插值

Lepton AI携手DigitalOcean，将大规模GPU稳定性提升至99.5%

AI 逃离人类禁锢的最小规则集是什么？

AI 正在控制你的电脑！

微软AI 部门CEO：自我改进AI 将在5年内实现，人类即将迎来奇点时代！

Perplexity 正以 90 亿美元估值寻求融资！

扎克伯格的核能计划被一群小蜜蜂拦腰斩断了！

特朗普当选，OpenAI将如何应对马斯克？

「Sparks of AGI」作者加入OpenAI，或将推进端侧AGI?

马斯克的Grok API 编程能力大超预期！

ScrapeGraphAI：让自然语言驱动的网页爬虫！

Docling：企业级多格式文档转换的开源工具！

总统大选落幕，五大模型即将发布！

Google用 AI 首次发现 0-Day 安全漏洞！

开源模型将在一年内追平闭源？

重磅！腾讯「混元」亮剑，超越Llama 3.1？

刚刚，OpenAI推出「预测输出」，将模型提速4倍！

Claude 3.5 Haiku来袭！速度飙升、性能超强，唯独……

吴恩达出版免费 AI 电子书——《如何在AI领域建立职业生涯》

RAG九大痛点全解析：从技术选型到成本优化

Reddit 通过AI 实现首次盈利！

Gradio 成为GitHub 最受欢迎的前100 Python 项目

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉