1. 主题
语言模型不听话怎么办?关于格式忠实性的探索
2. 时间
2025.1.3 20:00-21:00
3. 引言
遵循给定的格式要求生成结构良好的文本是大语言模型的一项基本功能。然而,语言模型往往不能充分满足这些要求。我们将这一功能称为“格式忠实性”,并对其展开研究。通过对格式相关问题的广泛考察,我们提出了以模型为中心的格式忠实性衡量基准。通过对格式相关问题可识别性的认识,我们提出了基于强化学习的语言模型适配方法。
相关研究形成的论文收录于AAAI2025。
论文:ReFF: Reinforcing Format Faithfulness in Language Models across Varied Tasks
链接:https://arxiv.org/abs/2412.09173
4. 大纲
格式忠实性的概念 FormatBench:格式忠实性的评估 ReFF:格式忠实性的提升
5. 个人介绍
姚嘉树,北京理工大学博士生,本科毕业于北京理工大学。曾在 ACL、AAAI 以第一作者身份发表论文。研究兴趣包括机器翻译、大模型安全、具身智能等。
入群
欢迎加入NICE每周分享交流群,可与NICEer唠嗑,以及第一时间收到后续NICE分享报告的通知。加群通过小助手认证,群内无广告。