大型语言模型实战指南

文摘   2024-09-12 09:09   日本  

大家好,我是刘聪NLP。

是的,没错,对的,很酷,又出了一本大模型书籍《大型语言模型实战指南:应用实践与场景落地》

我将在公众号抽3位粉丝送上签名版的新书,规则会在文末给出。

文末送书、文末送书、文末送书,重要的事情说三遍!!!

当然也欢迎大家多多支持哈。

先说说为啥要写这本书

2023年的一年时间,大多数人基本上都在做底座大型语言模型的搭建、领域大型语言模型的预训练或微调,在去年也出版了一本《ChatGPT原理与实战》的书籍,对大型语言模型的知识体系进行了细致的梳理,并且通过实战帮助读者可以从零搭建自己的ChatGPT模型。

但通过很多读者的反馈,上本书对大型语言模型应用部分的讲解不够细致,并且随着技术和时代的发展,大型语言模型如何进行场景落地变得尤为重要。

因此,经过一番思考和准备之后,我决定从大型语言模型应用落地角度出发,进一步系统梳理大型语言模型的相关技术,并帮助读者学习如何利用开源大型语言模型优化自身领域或场景中的效果。

不可否认的是,大模型技术发展是飞快地,图书出版的速度一定没有网络资料更新的迅速,但图书更强调知识的系统性和完整。我认为技术会持续更新换代,书中提到的很多技术也许在不远的未来便被更为强大的技术所取代,但这并不影响我们学习这一系列的技术,因为学习这些技术本身会引发更深层次的思考。

《大型语言模型实战指南》一书从大模型应用落地角度出发,系统梳理了大模型的相关技术,也帮助读者学习如何优化开源大模型在不同领域或场景中的效果,详细讲述了如何搭建角色扮演、信息抽取、知识问答、AI Agent等各种各样的大模型应用。

配套代码见:https://github.com/liucongg/LLMsBook

下面摘一些书中内容。

角色扮演

角色扮演应用主要利用大模型来模拟不同属性和风格的人物和角色,如游戏人物、动漫角色、网络小说的主角、电影人物、电视人物,以及历史名人等,旨在为用户带来更精细、更沉浸的交互体验。

图片来自:From Persona to Personalization: A Survey on Role-Playing Language Agents

为了确保用户获得最佳的体验,角色扮演应用不仅需模拟角色基本的对话流程,还要求大型语言模型深入理解角色的性格、故事背景、情感状态和行为模式,从而塑造出更为智能和生动的AI角色。可以应用在教育、游戏、咨询、创作、培训等多个领域中。

图片来自:Two Tales of Persona in LLMs: A Survey of Role-Playing and Personalization

RAG

RAG(Retrieval-Augmented Generation,检索增强生成)技术,主要是在大型语言模型生成答案之前,通过检索方法从数据库中检索与用户查询相关的信息,利用这些相关信息指引大型语言模型进行答案生成。

RAG不仅极大程度低解决大型语言模型幻觉的问题,还提高模型回复的可靠性,提供生成答案的溯源信息,并且通过更新外部知识库实现对于知识的更新,无需重新训练模型,减少了模型训练更新的成本。目前,已经成为大型语言模型应用落地的重要方向。

RAG的整体流程主要涉及查询处理模块、内容检索模块、内容组装模块和大模型生成4个部分。当系统接受到用户查询Query进行初步处理后,利用向量检索模型从提构建的向量知识库中检索到与其最相关的文档片段内容,再通过提示工程对用户查询Query和文档片段进行组装,最后利用大模型生成一个答案。

图片来自:Retrieval-Augmented Generation for Large Language Models: A Survey

AI Agent

Agent是能够感知自身所处环境、自我决策并采取行动的人工智能实体。Agent技术的应用范围广泛且多样化,它们不仅仅是简单的自动化工具,而是能够在多个领域中提供高效和创新的解决方案。

  • 自动化和效率化的工具:Agent技术在自动化复杂任务和提高工作效率方面起着至关重要的作用。从简单的数据查询到复杂的决策制定,它们都能显著减少人工操作的需求,优化工作流程。
  • 数据分析和处理:在处理大量数据和执行复杂分析方面,Agent技术发挥着重要作用。它们能够从海量数据中提取有价值的信息,为企业和研究者提供快速、准确的洞察。
  • 交互式用户体验:Agent技术通过自然语言处理和上下文感知技术,提供个性化和互动的用户体验,从而改善用户交互。
  • 智能决策支持:Agent技术作为决策支持工具,在分析复杂情况和提供基于数据的建议方面表现突出,特别是在商业、医疗和科研等领域。
  • 集成与扩展服务:Agent能够集成多种工具和服务,通过API调用外部服务,为用户提供全面和扩展的功能。Agent技术可以通过API调用外部服务,将不同的功能和信息源集成到一个统一的接口中。
  • 自适应学习和进化:Agent技术具有学习和适应的能力,能够根据用户反馈和行为模式不断进化,以更好地满足用户需求。
图片来自:The Rise and Potential of Large Language Model Based Agents: A Survey

以上内容摘自《大型语言模型实战指南:应用实践与场景落地》


送书规则

大家在该文章下进行留言,留言点赞靠前的3位同学,每人可以获得一本《大型语言模型实战指南:应用实践与场景落地》图书。

欢迎大家踊跃留言,可以聊聊大模型最近发展,也可以聊聊大模型有哪些好的应用,或者做大模型这段时间的心路历程。

PS:如果存在点赞相同的情况,以是时间排序,先留言的,排名靠前。

截至时间为9月18日22点22分。

最后放上新书的海报,没有抽到的同学,也欢迎大家购买,提前感谢大家的支持啦!!

NLP工作站
日常分享AIGC前沿知识&落地经验总结,也欢迎关注《ChatGPT原理与实战》、《大型语言模型实战指南》两本大模型相关书籍
 最新文章