演进指令方法增强版：自动演进指令

文摘科技 2024-07-23 22:12 加拿大

Automatic Instruction Evolving for Large Language Models

演进指令方法增强版：自动演进指令‍‍‍‍‍‍‍‍‍

‍‍‍‍‍

Evol-instruct方法作为一种新增指令微调数据的方法在去年受到了一定关注，熟悉这种方法的朋友应该知道Wizard系列的LM，Coder和Math都利用了类似的方法或衍生方法，简而言之就是将已有的种子数据里的指令复杂化然后让模型生成对应的输出，从而用于增强训练。但是这种问题的缺陷在于，Evol时的指令具体如何编写是需要一些domain knowledge的，比如说代码领域可行的“增加时间或空间复杂度”的要求显然不能用在聊天这一domain上，因此自动化Evol这个过程是有必要的，作者希望有一种方法能1.自动化设计指令演进方法；2.保持指令演进过程中平稳运行，避免出现演进失败的情况（比如出现演进出没有答案的指令来）。作者提出一种“Auto Evol-Instruct”的方法，细节见下图，仔细看一下就能理解。

首先，为了从手动设计演进指令转变到自动生成，作者采用一种通用的初始演进方式，为了通用性，他们使用了一个LLM作为优化器来迭代式优化最初的演进方法来确保对于给定指令集上有最小的错误率，另外还有一个专用于生成演进指令的LLM。从上图中可以看到这种对指令的优化有两个关键阶段，第一个是”演进轨迹分析（Evol Trajectory Analysis）“，此时优化器LLM会仔细分析演进LLM生成的指令中的潜在问题，比如产生了一条没有解的指令或者指令相比初始指令并没有提升复杂性；第二个阶段叫”演进方法优化（Evolving Method Optimization）“，优化器LLM会试图解决前一阶段观察出来的问题。这两个阶段相互更替重复实现指令的渐进式演进。另外在图的右半部分，优化器LLM有时难以持续提供建设性反馈和增强演化方法。为增强方法的稳定性，作者从Self-Consistency中学习，采取了一种叫作Multiple Optimization的策略，即在每一步中，优化器LLM进行m次采样解码的分析和优化。这生成了m种不同的潜在改进演化方法，即图1中的e1_t至em_t，使模型能够同时探索更多可能性。

把初始演进方法的prompt贴在上面，这论文没什么太难的东西，直接看结果。他们在三种任务上做了评测，分别是指令遵循、数学推理和代码生成，作者做实验的具体设置在table1，实验结果在tab2，总结来说有以下结论：1.提出的方法在不同模型规模上均显著提高了指令遵循能力，在小模型上提升高一些；2.该方法显著提高了数学推理能力，比如只使用了少量的指令数据（仅7K）并在Mixtral-8x7B上微调后能超过GPT-3.5-turbo，这表明该方法能显著提升现有数学数据的质量上限；3.方法也能有效提高模型的代码生成能力，如在33B规模上，Evol-Instruct改进不明显，而新方法与种子数据相比显示出5.4的提升。

作者对他们的方法做的分析不来写了，我很懒。

撰文：戴剑波；编辑：戴剑波

未经本公众号授权不得转载，欢迎转发。

SparksofAGI

人工智能前沿论文分享（注意！未关注的朋友我是回复不了您的私信的）

香港科技大学（广州）郭志江老师招收25 Fall全奖PhD/实习生，博士生奖学金每月1.5万！

COCONUT：将推理放在连续潜在空间进行

一种能提升Transformer复杂规划任务表现的训练目标：MLM-U

别教授它，去激励它

现有数据集普遍存在偏差？DART-Math：使用难度感知拒绝调优增强数学问题求解

代码数据在预训练时要训吗？训多少？退火时要放吗？

SELF-GUIDE：让模型自主生产任务特定微调数据

分词器暴露了模型训练数据分布，比如Claude系列模型用了57%的代码数据

可“自主进化”的Agent？首个端到端的智能体符号化训练框架开源了

演进指令方法增强版：自动演进指令

OpenAI危？！Claude已经超越GPT系列了？尤其在代码上...

MIT、清华、剑桥等发布元推理能力评测集：从答题到阅卷，还以MMLU评测大模型你就out了

缩放与评估稀疏自编码器

关注者推荐：当模型在胡说的时候知道自己在胡说吗？

微调真的导致了模型幻象吗？

AGI 的最终挑战（一）：AI for Math

LayerSkip——新的训练与推理范式：层Dropout，早期退出机制与自投机解码结合

仿照计算机系统的权限概念，指令层级帮助大模型防范多种攻击

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉