综述 | 大模型的可控文本生成

文摘 2024-08-23 23:01 美国

大家好，我是刘聪NLP。

大模型已经展现出了较强的文本生成能力，但随着使用场景变得越加复杂和严格，除了避免生成误导或不当言论内容外，往往还希望可以满足用户的特殊需求。而可控文本生成就是为了在保持文本生成有用性、流畅性和多样性的同时，保证文本符合预定的控制条件，例如安全性、主题一致性、语言风格等。

今天给大家带来一篇综述，介绍大模型可控文本生成（Controllable Text Generation, CTG）的相关技术。

Paper: https://arxiv.org/abs/2408.12599
Github: https://github.com/IAAR-Shanghai/CTGSurvey

可控文本生成的任务

在CTG领域，任务可以大致分为两种类型：内容控制（或语言控制/硬控制）和属性控制（或语义控制/软控制）。

CTG方法根据干预模型生成的阶段分别为训练阶段和推理阶段。

提示工程：通过修改输入提示来指导模型的输出。
潜在空间操纵：通过调整模型隐藏层内的激活状态来控制生成的文本。
解码干预：通过修改生成输出的概率分布或在解码过程中应用特定规则来影响Token的选择，以改变输出文本，包括分类器引导、类条件语言模型、基于能量的模型、模型自反馈和外部知识。

CTG任务的评估可分为自动评估、人工评估和基于LLM的评估三种。

目前可控文本生成的评测榜单主要包括：CTRLEval、ConGenBench、 CoDI-Eval、FOFO。

本人的新书《大大型语言模型实战指南》马上就要上架啦，大家可以关注公众号「NLP工作站」，加入交流群。到时候我会在群里抽几本送给粉丝们。

PS：给公众号添加【星标⭐️】不迷路！您的点赞、在看、关注是我坚持的最大动力！

我们的口号是“生命不止，学习不停”！

日常分享AIGC前沿知识&落地经验总结，也欢迎关注《ChatGPT原理与实战》、《大型语言模型实战指南》两本大模型相关书籍