新闻｜我组7篇论文成果被 EMNLP 2024 录用

学术 2024-09-23 18:10 北京

近日，EMNLP 2024（Empirical Methods in Natural Language Processing）论文录用结果公布，THUNLP 7 篇论文被 EMNLP 2024 录用。

EMNLP 是计算机语言学和自然语言处理领域的顶级国际会议，在相关领域享有较高的学术声誉，其涉及领域包括但不限于机器翻译、文本生成、文本分类、信息抽取、问答系统、语言模型等研究方向。该会议计划于2024年11月12日至11月16日在美国佛罗里达州迈阿密召开。我组共有7篇学术论文被EMNLP 2024录用，其中，5篇主会，2篇Findings。

我组录用论文信息

Controllable Preference Optimization: Toward Controllable Multi-Objective Alignment

尽管基于大规模语料库训练的大语言模型（LLMs）所具有的强大能力已经有目共睹，但为了开发出符合人类偏好的强大模型，如何让语言模型与多维度的人类偏好和价值观“对齐”是值得深入研究的课题。在人类偏好的多目标优化过程中，在一个目标（例如，无害性）的对齐效果的提升可能会导致其他目标（例如，帮助性）性能的降低，这种权衡被称为“对齐税”。现有的对齐技术大多是单维度或者直接混合对齐数据进行训练，因此并未从本质上缓解对齐目标之间的关系，导致了次优的权衡和对于不同维度的优化存在灵活性差等问题。为了应对这一挑战，论文提出了可控偏好优化（CPO）算法，其核心理念是可控，通过多目标偏好标记（preference token）来确定优化方向，从而将多目标优化问题转化为条件化的多目标优化问题。研究基于HHH指标（Helpfulness、Honesty、Harmlessness）展开，通过偏好标记控制不同维度的偏好分数，从而减少需要最大化期望的维度的数量，有效缓解对齐目标之间的冲突。同时研究提出了UltraSafety数据集，弥补了UltraFeedback在安全方面的数据的空缺。

作者： 郭一驹*，崔淦渠*，袁立凡，丁宁，孙泽旭，孙博闻，陈慧敏，谢若冰，周杰，林衍凯，刘知远，孙茂松

合作方： 中国人民大学，腾讯

收录类型： 主会

➤ 论文链接

📑 https://arxiv.org/abs/2402.19085

Ouroboros: Generating Longer Drafts Phrase by Phrase for Faster Speculative Decoding

投机采样是一种广泛使用的方法，可以在不损害模型效果的情况下加速大语言模型（LLM）的生成过程。它使用现有的小模型进行起草，然后使用目标模型低成本地并行验证。在这种起草验证的框架下，起草效率是目前投机采样的加速瓶颈。因此，以更低的成本生成更长的草稿可以显著提高解码速度。为了实现这一点，我们提出了 Ouroboros，它可以生成草稿短语来并行化起草过程，同时以无需训练的方式用短语延长草稿。在各种典型文本生成任务上的实验结果表明，Ouroboros 可以在不对模型进行任何微调的前提下实现较投机采样 2.4 倍的加速，较传统自回归生成 3.9 倍的加速。代码已开源于 https://github.com/thunlp/Ouroboros

作者： 赵威霖*，黄宇翔*，韩旭，徐旺，肖朝军，张新荣，方晔玮，张开活，刘知远，孙茂松

合作方： 面壁智能

收录类型： 主会

➤ 论文链接

📑 https://arxiv.org/abs/2402.13720

Beyond the Turn-Based Game: Enabling Real-Time Conversations with Duplex Models

随着大型语言模型（LLMs）日益渗透到日常生活中，人们对能够模拟人类对话的实时交互的需求不断增加。传统的基于回合制的LLMs聊天系统抑制用户在系统生成响应时进行即时互动。为了克服这些限制，我们将现有的LLMs改造为双工模型，使其能够在生成输出的同时聆听用户，并动态调整自己以提供即时反馈。

具体来说，我们将对话中的查询和响应分割成若干时间切片，然后采用时分复用（TDM）编码-解码策略，伪同步处理这些切片。此外，为了使LLMs能够足够熟练地处理实时对话，我们构建了一个微调数据集，该数据集由交替的查询和响应时间切片组成，涵盖了即时交互中的典型打断类型。我们的实验表明，尽管对话的查询和响应被分割成不完整的切片进行处理，但通过对我们的数据集进行少量微调，LLMs在标准基准上的原有性能得以保留。自动化评估和人工评估结果表明，与原始的LLMs相比，双工模型使用户与AI的交互更加自然和拟人，并大大提高了用户满意度。

作者： 张新荣，陈英发，胡声鼎，韩旭，徐子航，许缘伟，赵威霖，孙茂松，刘知远

合作方： 面壁智能

收录类型： 主会

➤ 论文链接

📑 https://arxiv.org/abs/2406.15718

Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs

类案检索旨在为给定的案件基本事实提供相似案例作为参考，这一任务对于促进相似案例的判决一致性、增强司法公正以及提高法官工作效率至关重要。然而，现有研究在现实应用中面临两大挑战：现有研究主要关注使用长查询进行的检索，这与现实世界的场景并不匹配；此外，当前类案检索数据集通常仅包含数百个查询，不足以满足神经模型的训练需求。为解决这些问题，我们引入了一种自动化的方法来构建非对称的查询-候选对，并构造了迄今为止最大的类案检索数据集，其规模是现有数据集的数百倍，该数据集能够为类案检索模型提供丰富的训练信号，实验结果表明，使用我们的数据集进行训练的模型在两个广泛使用的类案检索测评数据集上取得了最先进的结果。此外，我们的构建方法也可以应用于民事案件并取得优秀的结果。

作者： 高骋*，肖朝军*，刘正皓，陈慧敏，刘知远，孙茂松

收录类型： 主会

DecorateLM: Data Engineering through Corpus Rating, Tagging, and Editing with Language Models

大型语言模型（LLMs）的性能在很大程度上受预训练语料库的影响，而该语料库包含大量由模型处理的未标注数据。尽管其在模型性能中扮演关键角色，但由于数据量庞大且缺乏样本级别的质量标注和改进，数据质量的保障极具挑战性。本文介绍了DecorateLM，一种通过数据评分（Rating）、标签（Tagging）和编辑（Editing）来优化预训练语料库的数据工程方法。具体而言，DecorateLM根据质量标准对文本进行评分，使用层次标签对文本进行标记，并将文本编辑成更规范化的格式。鉴于预训练语料库的巨大规模，使用LLM来装饰整个语料库效率较低。因此，为平衡性能与效率，我们利用大型语言模型精心标注了一个训练语料库，并将数据工程专业知识蒸馏到一个参数量为1.2 B的小语言模型（SLM）中。随后，我们应用DecorateLM提升了训练语料库中100 B个词元，选取了45 B个代表高质量和多样性的词元，用于进一步训练另一个参数量为1.2 B的LLM。结果表明，使用这种高质量数据可以显著提升模型性能，从而验证了这一方法在提升预训练语料库质量方面的强大效力。

作者： 赵元乾*，戴振宁*，张祎凡*，胡声鼎*，周界，巴云琦，蔡杰，刘知远，孙茂松

合作方： 面壁智能

收录类型： 主会

Beyond Natural Language: LLMs Leveraging Alternative Formats for Enhanced Reasoning and Communication

自然语言长期以来一直是人类认知和交流的主要形式，因此在大型语言模型（LLMs）的发展和应用中同样起着关键作用。然而，除了自然语言之外，LLMs在预训练过程中还接触过各种非自然语言格式，如代码和逻辑表达式。自然语言作为LLMs的最佳格式，特别是在单一LLM推理和多代理通信中的地位尚未得到充分研究。在本研究中，我们通过探索非自然语言格式在这些情境中的效用，挑战了自然语言的默认使用。我们表明，允许LLMs在推理或通信之前自主选择最合适的格式，可以使不同LLMs的推理效率提高3.3%到5.7%，并在多代理通信中将令牌使用量减少高达72.7%，同时保持通信效果。我们的全面分析进一步揭示，LLMs能够从有限的任务指令中设计出一种格式，且该设计的格式可以有效地在不同的LLMs之间转移。有趣的是，LLMs决定的结构化通信格式与既定的代理通信语言表现出显著的相似性，这表明在代理通信中自然地演化出高效、结构化的通信方式。

作者： 陈纬泽，袁辰飞，原嘉锐，苏裕胜，钱忱，杨成，谢若冰，刘知远，孙茂松

合作方： 北京邮电大学，腾讯

收录类型： Findings

➤ 论文链接

📑 https://arxiv.org/abs/2402.18439

Large Language Model-based Human-Agent Collaboration for Complex Task Solving

近年来，学术界对将大模型应用于自主智能体的构建产生了浓厚的兴趣。然而，基于大模型的智能体在应对动态环境变化和深入理解人类需求方面，仍存在明显的不足。在本文中，我们提出了基于大模型的人机协作问题，旨在探讨其在解决复杂任务时的协同潜力。在此基础上，我们提出了一种基于强化学习的人机协作方法，称为ReHAC。该方法引入了一个策略模型，用以判断在任务解决过程中最适合进行人类干预的关键节点，并构建了一个人机协作数据集，在离线强化学习环境中训练该策略模型。实验验证结果表明ReHAC模型的有效性。研究结果展示了人类与基于大模型的智能体在协作中的协同效应，尤其是在有计划、有限度的人类干预下，显著提升了复杂任务的完成表现。

作者： 冯雪扬*，陈志远*，秦禹嘉，林衍凯，陈旭，刘知远，文继荣

合作方： 中国人民大学

收录类型： Findings

➤ 论文链接

📑 https://arxiv.org/abs/2402.12914

关于我们

清华大学自然语言处理与社会人文计算实验室（TsinghuaNLP）成立于 20 世纪七十年代末，是国内开展自然语言处理研究最早、深具影响力的科研单位，也是中国中文信息学会计算语言学专业委员会及中国人工智能学会因果与不确定性人工智能专业委员会的挂靠单位。实验室在学术总体带头人孙茂松教授及学术方向带头人刘洋教授、刘知远副教授的带领下，围绕以中文为核心的自然语言处理，在语言大模型、跨模态大模型、中文信息处理、机器翻译、知识图谱、智慧教育、社会人文和艺术计算等方面开展系统深入的研究，在国内外具有较大的学术影响。近年来，实验室承担了国家 973 项目、国家重点研发项目、国家社会科学基金重大项目等多项重要研究任务，并与腾讯、华为等企业建立密切的学术合作关系。

Website：http://nlp.csai.tsinghua.edu.cn/

Email：thunlp@163.com

GitHub：https://github.com/thunlp

https://github.com/OpenBMB

Twitter：https://twitter.com/TsinghuaNLP

THUNLP 长期开放招聘

TsinghuaNLP

清华大学自然语言处理与社会人文计算实验室，是中国中文信息学会计算语言专业委员会和中国人工智能学会不确定性专业委员会的挂靠单位。负责人为清华大学计算机科学与技术系孙茂松教授，核心骨干为刘洋教授，刘知远副教授。

最新文章

招聘｜个性化学生成长助手“清小搭”团队实习生招募

新闻｜我组5篇论文成果被 COLING 2025 收录

新闻｜清华本科生习作集结成书《AI群星闪耀时》正式出版

成果｜打破传统轮次规则，MiniCPM-duplex双工模型助力即时交互

获奖｜我组博士毕业生陈驰学位论文入选2024年度中国中文信息学会“博士学位论文激励计划”

获奖｜我组与幂律智能、清华大学法学院联合研究成果荣获2024“钱伟长中文信息处理科学技术奖”一等奖

新闻｜我组博士后研究员李霜洁顺利出站

《语言战略研究》多人谈：学术的激烈交锋会促进科技的深入发展

获奖｜我组教师刘知远获2024年北京市高校青年教学名师奖

成果｜RAGEval：实现实际场景检索增强生成系统（RAG）的“精准诊断”

招聘｜清华NLP实验室博士后招聘

招聘｜清华NLP实验室招聘工具学习与自主智能体方向科研实习生

新闻｜我组7篇论文成果被NeurIPS 2024录用

新闻｜我组7篇论文成果被 EMNLP 2024 录用

预告｜CNCC 2024技术论坛：端侧大模型

新闻｜我组师生参加 ACL 2024 学术会议

获奖｜我组荣获英特尔中国学术成就奖

成果｜LEGENT：具身智能体开放平台

新闻｜我组6篇论文成果被 COLM 2024 录用

获奖｜我组多名毕业生顺利毕业，并获多项荣誉

经典大模型公开课第二季，梦幻回归

成果｜基于深度学习的多策略增强对联自动生成方法

成果 | 智能体互联网（IoA）：编织异构智能体的协同智能网络

获奖｜我组毕业生丁宁、姚远获2024世界人工智能大会云帆奖

招聘｜清华NLP实验室诚聘大模型英才

OpenBMB × Hugging Face × THUNLP，联袂献上经典大模型课

讲座预告｜夏梦舟：训练与对齐语言模型：目标与数据管理的算法进展

成果｜Seq1F1B：节省50%显存的长文本模型流水线并行训练技术

成果｜大模型驱动的多智能体协作网络 MacNet，探究多智能体协作的Scaling Law

招聘｜清华NLP实验室招聘法律智能方向博士后及科研实习生

新闻｜我组2篇论文成果被 ACL 2024 Demo 录用

成果｜多智能体经验迭代精炼框架——实现多智能体经验动态积累以增强任务解决能力

StableToolBench：稳定的工具学习评测数据集

MiniCPM-V 2.5：登顶HuggingFace和GitHub Trending榜双榜首

成果 | CODIS：评估多模态大模型结合上下文理解图像的能力

新闻｜我组多篇论文成果被 ACL 2024 收录

预告｜CCF ADL第146期讲习班周五开讲，欢迎广大学者报名

新闻｜我组师生参加ICLR 2024学术会议

新闻｜我组6篇论文成果被 ICML 2024 收录

获奖 | 我组师生参加“吴文俊人工智能科学技术奖”颁奖典礼

清华NLP实验室招聘大模型方向博士后及研究员

预告｜CCF ADL讲习班第146期 “大模型自主智能体与群体智能”

成果 | 大模型驱动的自主智能体与群体智能

成果｜ProSparse：打造更加稀疏高效的大模型

成果 | MatPlotAgent：大模型驱动的数据可视化智能体

新闻｜我组三篇论文成果被 CVPR 2024 收录

成果｜大语言模型只懂自然语言？AutoForm通过非自然语言形式提升智能体推理与沟通效率

获奖 | 我组博士生姚远获2023年度吴文俊人工智能科学技术奖优秀博士学位论文奖

成果｜OlympiadBench: Olympiad-level 的双语、多模态的科学评测集

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉