提示工程——大模型中的提示词设计（下）

学术 2024-11-13 18:17 北京

‍‍

在当今的人工智能领域，大模型如GPT和BERT已展现出卓越的性能，被广泛应用于多种语言处理任务。然而，这些模型的训练成本极高，涉及昂贵的计算资源和大量的数据处理。如何在不重新训练模型的前提下有效利用已有模型，成为了一个重要的研究和应用方向。提示工程（Prompt Engineering）是一种通过设计精确的输入提示来最大化模型性能的技术，旨在通过优化输入的提示词影响模型输出，从而实现更精准的结果。提示工程（Prompt Engineering）为我们提供了一种成本效率高且灵活的方法，通过按照一定方法和规则设计输入的提示词来引导模型输出，从而适应特定的应用场景和领域。文章详细介绍了提示工程的原理及多种方法，如角色扮演和思维链，通过调整输入使模型更适应特定任务；还探讨了提示工程与大模型结合的多种方式，包括多模型集成、动态提示调整、迁移学习等。

提示工程与大模型融合

在提示工程的应用中，如何与大模型（如GPT、BERT等）高效结合，是提升AI系统性能的核心之一。大模型凭借其庞大的参数量和强大的语言生成能力，能够处理复杂的自然语言任务。然而，仅依赖大模型并不能充分发挥其潜力，提示工程通过巧妙的提示设计，为大模型的高效应用提供了新的可能。以下是提示工程与大模型结合的几种关键方法。

组合提示与多模型集成

提示工程不仅可以应用于单一的大模型，还可以通过多模型集成的方式，进一步提高系统的表现。大模型通常擅长处理自然语言任务，但在特定领域中（如图像识别、语音识别等），其他类型的AI模型可能具备更好的专业能力。通过提示工程设计，用户可以结合多个模型的优势，实现更复杂的多模态任务。例如，用户可以设计提示，将自然语言任务的输出作为输入引导给其他模型，如将GPT生成的文本作为输入传递给图像生成模型，从而完成图像描述生成任务。这样的提示设计可以大幅度提升多模态AI系统的协同工作效率。

动态提示与自适应模型

提示工程与大模型结合的另一种重要方法是通过动态调整提示内容，使模型能够适应不同的上下文需求。在一些复杂的任务场景中，简单的静态提示可能无法完全满足需求。动态提示通过根据用户交互反馈、上下文变化，实时调整输入提示的内容，使得大模型能够灵活应对不同的任务需求。例如，在对话系统中，动态提示可以根据对话的前后文内容、用户输入的情感或意图，自动调整提示，从而提升对话的流畅性和智能化水平。这种方法使提示工程在大模型中的应用更加灵活和精准，能够有效提高大模型的交互能力。

提示与迁移学习的结合

迁移学习是一种通过在不同领域或任务之间共享模型知识的技术，大模型往往具备强大的迁移学习能力。提示工程可以与迁移学习相结合，通过设计合适的提示，将大模型在一个领域中的知识迁移到另一个领域中使用。通过提示工程引导，模型能够在无需额外训练的情况下，直接应用于新的任务或领域。例如，将在通用语料库上训练的GPT模型，通过提示定制应用于法律或医学等专业领域任务。这种结合方式可以显著减少领域适应时间，降低训练成本，尤其适用于跨领域的大模型应用。

提示工程与大模型的结合为AI领域带来了更多的创新机会与应用前景。通过定制化的提示词设计、组合提示与多模型集成、动态提示调整以及迁移学习的应用，提示工程能够在不重新训练模型的情况下，充分发挥大模型的潜力。随着技术的不断进步，提示工程与大模型的结合方式将继续发展，推动AI技术在各个行业的深入应用，实现更智能、更高效的任务处理和决策支持。

提示工程当前的挑战和应对策略

当前是提示工程在大模型中应用的初期阶段，在评估模型输出、保护提示词资产以及在低容忍行业的应用方面有诸多挑战。我们需要在未来提示工程发展的道路上，逐步解决这些挑战带来的问题。

提示工程有效性量化评估

提示词的设计是提示工程的核心，直接影响大模型的输出质量。然而，目前缺乏有效的量化评估手段来衡量提示词的好坏。量化评估提示词有效性可以帮助开发者优化提示设计，提升模型在不同任务中的表现。该评估过程可以从两个关键阶段进行分析：提示输入阶段和模型输出阶段。

在提示输入阶段，提示词的设计需要通过几个核心指标来量化其有效性。提示词的结构化程度、使用的词汇是否精准以及是否具备领域专门性都至关重要。提示词的清晰度和简洁性也需要考虑，确保输入简明扼要，易于理解。提示词的语义丰富性决定了其能否为模型提供足够的信息来处理复杂任务，是评估提示词设计的关键因素之一。这些因素的量化可以通过统计词汇、句子结构分析以及语义深度评估等工具进行。

在模型输出阶段，提示词的有效性最终体现在模型生成的结果上。输出的准确性是首要的评估指标，通过与预期结果的对比，可以量化提示词的设计是否能引导模型生成符合任务要求的内容。模型输出的一致性也是重要的考量标准，评估不同输入提示词下，模型是否能稳定地产生类似的结果。输出与提示词的语义相关性也是关键，通过语义相似度量化工具可以衡量输出是否与提示词紧密相关。信息完整性也需要评估，确保模型输出涵盖提示词所要求的所有关键信息。这些量化评估结合自动化分析工具和用户反馈，能够为提示工程提供系统的有效性评估方法，帮助优化提示设计和提升模型的实际应用效果。

提示词资产的保护

随着提示工程的逐渐普及，高效的提示词本身成为了重要的资产。在竞争激烈的行业中，有效的提示词可以显著提高模型的性能，成为企业的核心竞争力之一。企业需要保护这些提示词，防止未经授权的复制或泄露。

申请专利或版权是有效的法律手段来保护企业对提示词资产的所有权；在企业内部，实施严格的访问控制措施，确保只有授权人员才能访问提示词；建立访问审计机制，记录和监控提示词的使用情况，防止未经授权的访问和泄露；企业可制定一个安全的内部分享机制，以便在团队内部实现有效地分享的同时，避免资产风险。

在低容忍行业的应用

在低容忍度行业（如医疗、航空和金融等领域）应用提示工程面临极高的风险。在这些领域，任何小的错误或不准确都可能导致严重的后果，如误诊、安全事故或财务损失。如何确保模型在这些行业中稳定、安全地运行，是一严峻挑战。

在错误低容忍行业，可建立覆盖模型开发、测试和部署各环节的严格质量控制体系，使用高质量的数据集进行训练和测试，来确保模型输出的准确性和可靠性。在医疗领域，使用经过严格审查的医疗数据集进行模型训练。部署模型后，实施持续监测和反馈机制，实时监控模型的表现，交易系统的输出，一旦检测到异常交易，立即触发警报并发现异常或错误，能够迅速响应和修正；在金融领域，实时监控交易系统并采取措施。模型的开发和应用必须严格遵循所在行业的标准和法规要求，确保所有输出都经过严格验证，并符合行业规范。在航空领域，确保模型符合航空安全管理的所有规定和标准。采用多层验证和冗余设计，确保模型输出的可靠性。

提示工程的发展不仅依赖技术创新，还需要政策制定者和监管机构、行业领导者和技术开发者的紧密合作。通过集体努力，可以推动提示工程向更高效和准确的方向发展，满足各行业的不同需求。建立多维度评价体系、保护提示词资产、在低容忍行业应用中实施严格的质量控制和监测机制，将是解决当前提示工程挑战的有效策略。这些措施能够帮助企业在各个应用领域中更好地利用大模型的潜力，同时保障其输出的可靠性和安全性。

[参考文献]
[1]LIU P, YUAN W, FU J, et al. Pre-train, prompt, and predict: a systematic survey of prompting methods in natural language processing[J]. ACM computing surveys, 2023, 55(9): 1-35.
[2]BROWN T B, MANN B, RYDER N, et al. Language models are few-shot learners[J/OL]. 2020.DOI:10.48550/arXiv.2005.14165.
[3] WEI J, WANG X Z, SCHUURMANS D, et al. Chain-of-thought prompting elicits reasoning in large language models[J]. arXiv preprint arXiv:2201.11903, 2022.
[4]ARORA S N. Ask me anything: a simple strategy for prompting language models[J]. arXiv preprint arXiv:2210.02441, 2022.
[5]李姝;韦有涛;乔芷琪. 大语言模型Prompt的设计原则和优化流程[J]. 中国信息化,2024,(09):31-33.
[6]张玲玲;黄务兰. 基于ChatGPT API和提示词工程的专利知识图谱构建[J]. 情报杂志,,:1-8.
[7]雷鸣. 自然语言提示驱动的智能信息分析模式研究[J]. 情报理论与实践,,:1-10.
[8]黄峻;林飞;杨静;王兴霞;倪清桦;王雨桐;田永林;李娟娟;王飞跃. 生成式AI的大模型提示工程：方法、现状与展望[J]. 智能科学与技术学报,2024,(02):115-133.
[9]方海光;王显闯;洪心;舒丽丽. 面向AIGC的教育提示工程学习提示单设计及应用[J]. 现代远距离教育,2024,(02):62-70.

审稿：李连源、吴博、葛欣 | 业务研究所
作者：程刚 | 业务研究所

往

期

精

彩

关于我们：中移智库以中国移动研究院为主体建设，广泛汇聚数字经济研究力量，着力提升政策性课题研究的专业性和权威性，并扩大研究成果的影响力、公信力、传播力，为数字经济的高质量发展贡献智慧力量。

http://mp.weixin.qq.com/s?__biz=MzAwMTA3ODExOQ==&mid=2651746167&idx=2&sn=da287f1e199915e1a3560186e858ecb7

中移智库

中移智库以中国移动研究院为主体建设，广泛汇聚数字经济研究力量，着力提升政策性课题研究的专业性和权威性，并扩大研究成果的影响力、公信力、传播力，为数字经济的高质量发展贡献智慧力量。联系我们：cminfo@chinamobile.com

最新文章

中移智库月度热文TOP10

对数据要素发展的思考与建议

全球卫星互联网季度观察（2024年11月）

银发经济月度观察（2024年10月）

无源物联核心网技术研究与标准推进

3D内容生成技术及应用场景探究

泛XR产业发展白皮书

提示工程——大模型中的提示词设计（下）

中国移动研究院多项成果入选国务院国资委课题成果集

提示工程——大模型中的提示词设计（上）

6G网络内生AI技术白皮书（1.0）

6G通感算智融合原生基座技术白皮书

NR ATG标准化概述

实时通信融合AI平台重构话音生态

OISA打造GPU卡间开放互联生态

中国移动杨杰：打造原创技术策源地提升信息通信话语权

“弈衡”多模态大模型评测体系白皮书

5G-A赋能绿色通信：节能标准进展，挑战与展望

一文读懂裸眼3D技术

AI赋能空天地海一体化网络资源管理

中国移动研究院张滨：骚扰电话治理关键要以“智”助“治”

新一代信息技术经济月报（2024年第10期）

国际发展环境洞察（2024年第九期）

SIM卡产业链国产化现状简析

品牌科技形象塑造经验及思考

5G小基站发展现状和发展趋势

移动研究院黄宇红：低空经济安全起飞，要牵牢通信这根“风筝线”

高精度工业视觉检测技术与应用白皮书（2024年）

数据生成技术在工业领域的应用与展望

拥抱移动AI时代共筑5G-A与AI融合发展新动能

数据要素市场月度观察（2024年10月）

中国移动研究院段晓东：布局安全技术，护航6G网络发展

光场视频采传技术及应用

一图读懂 | 2024中国移动全球合作伙伴大会“深化改革共促新质生产力发展”研讨会

中移智库月度热文TOP10

5G-A无线融合新架构白皮书

【智家观察】家庭算力终端专题研究

中国银发文旅数智化趋势洞察报告

中移智库联合主办粤港澳大湾区数字经济创新发展研讨会

中移智库发布“汇智计划” ，首批智库协同中心授牌

中国移动总经理何飚：以AI做强高质量产品供给

5G轻量化技术（RedCap）行业解决方案白皮书

中国移动杨杰：实施“AI+”行动计划，共赢数智新未来

国外人工智能数据安全规制及对我国的启示

面向高铁沿线场景的“比萨天线”创新覆盖技术

RFID领域ARC认证模式对我国的启示

中国移动李慧镝：智算规模超26EFLOPS，加速迈向算网3.0新阶段

丰收节里的中国移动智慧农业科技“密码”

中国移动高同庆：深化融数强算注智，加快发展新质生产力

2024年1—8月通信行业运行基本平稳，电信业务总量保持两位数增长

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉