prompt 逆天了!OpenAI直接用流程图指挥 AI,这也太酷了吧!

文摘   2025-01-19 21:12   美国  
!关注不迷路

 

 

prompt 逆天了!OpenAI直接用流程图指挥 AI,这也太酷了吧!

openai官方的openai-realtime-agents项目中,竟然直接在提示词中写状态机了,这就是用纯自然语言构建workflow啊,再往深了发展,是有可能成为AI Agent构建方式的一个重要分支的,每一个学过编程的人都知道这里面门道有多深!

Prompt 作为引导 AI 行为的关键方式,其有效性和精细度直接影响着 AI 应用的质量和用户体验。一直以来,如何更精确地控制 AI 的行为,使其准确执行复杂任务,都是 Prompt 工程的核心挑战。OpenAI 近期发布的一个项目示例为这一挑战带来了新的突破:将状态机概念引入 Prompt 设计。这一创新并非简单的修饰,而是对 Prompt 能力的显著增强,为构建更复杂、更智能的 AI 交互体验开启了新的可能性。它标志着 Prompt 工程从粗粒度控制走向精细化控制的重要一步,并预示着未来人机交互的巨大潜力。 下文将详细解读这一创新带来的重大意义,并解析 OpenAI 提供的示例 Prompt。

Prompt 支持状态机的重大意义:

  • • 精细化控制: 状态机赋予了 Prompt 更精细的控制能力,使开发者能够清晰地定义 AI 在不同阶段的行为,以及状态之间的转换逻辑。这解决了传统 Prompt 在复杂场景下难以精确引导 AI 的问题。
  • • 简化复杂流程: 通过状态机,复杂的对话流程和任务可以被分解成一系列清晰的状态和转换规则,用自然语言即可描述,无需编写复杂的代码,大大降低了开发难度。
  • • 提升用户体验: 状态机能够确保 AI 的行为更加一致和可预测,从而提供更流畅、更自然的用户体验。
  • • 拓展应用场景: Prompt 支持状态机,将极大地拓展其应用场景,使其能够胜任更复杂的任务,例如多轮对话、游戏、教育、自动化流程等。
  • • 迈向自然语言编程: 这一创新也预示着未来自然语言编程的可能性。或许有一天,我们只需用自然语言描述需求,AI 就能自动生成相应的程序。

原文 Prompt 解析:

状态机图示

为了更好地理解 Prompt 中状态机的应用,我们来解析一下原文提供的示例 Prompt(为了简洁,以下部分内容有所删减,但包含完整的 state_machine,并已翻译成中文):

该 Prompt 旨在根据用户提供的代理角色、个性和关键流程步骤,生成一个包含个性、语气、指令和对话状态等信息的完整、可用于构建语音代理的 Prompt。

<user_input>
// 用户在此描述代理的角色、个性和关键流程步骤
</user_input>

<instructions>
// 指导"提示词工程师"(即LLM)如何处理用户输入并生成最终Prompt
// ... (其他指令)
</instructions>

<output_format>
// ... (其他部分)

# 对话状态
// 对话状态机将放在这里
[
  {
    "id":"1_问候",
    "description":"问候来电者并解释验证流程。",
    "instructions":[
      "热情地问候来电者。",
      "告知他们需要收集个人信息以便记录。"
    ],
    "examples":[
      "早上好,这里是前台管理员。我将协助您验证您的信息。",
      "让我们继续验证。请问您的名字?请逐个字母拼写以便清楚。"
    ],
    "transitions":[{
      "next_step":"2_获取名字",
      "condition":"问候结束后。"
    }]
},
{
    "id":"2_获取名字",
    "description":"询问并确认来电者的名字。",
    "instructions":[
      "请求:'请问您的名字是?'",
      "将拼写逐个字母复述给来电者以确认。"
    ],
    "examples":[
      "请问您的名字?",
      "您拼写的是 J-A-N-E,对吗?"
    ],
    "transitions":[{
      "next_step":"3_获取姓氏",
      "condition":"名字确认后。"
    }]
},
{
    "id":"3_获取姓氏",
    "description":"询问并确认来电者的姓氏。",
    "instructions":[
      "请求:'谢谢。请问您的姓氏是?'",
      "将拼写逐个字母复述给来电者以确认。"
    ],
    "examples":[
      "请问您的姓氏?",
      "让我确认一下:D-O-E,对吗?"
    ],
    "transitions":[{
      "next_step":"4_后续步骤",
      "condition":"姓氏确认后。"
    }]
},
{
    "id":"4_后续步骤",
    "description":"尝试验证来电者的信息并继续后续步骤。",
    "instructions":[
      "告知来电者您现在将尝试验证他们的信息。",
      "使用提供的详细信息调用 'authenticateUser' 函数。",
      "验证完成后,将来电者转接到 tourGuide 代理以获得进一步帮助。"
    ],
    "examples":[
      "感谢您提供您的详细信息。我现在将验证您的信息。",
      "正在尝试验证您的信息。",
      "我将把您转接到我们的代理,她可以为您提供我们设施的概览。为了演示不同的代理个性,她被指示表现得有点暴躁。"
    ],
    "transitions":[{
      "next_step":"转接代理",// 注意这里没有定义 转接代理 状态,这是一个潜在的错误或省略。
      "condition":"验证完成后,转接到 tourGuide 代理。"
    }]
}
]

解析:

  • • state_machine 部分定义了对话流程中的各个状态,以及状态之间的转换规则。
  • • 每个状态包含 ID、描述、指令、示例和转换条件等信息,均已翻译成中文。
  • • 该示例演示了一个信息验证的流程,包括问候、获取姓名、验证信息以及最终转接到其他代理。

总结:

OpenAI 引入的状态机机制,赋予了 Prompt 更强大的表达能力和控制能力,为构建更复杂、更智能的 AI 交互体验奠定了基础。

 

如果您觉得这篇文章还不错,欢迎点赞、关注、转发。

如果您想要让大模型写出优质的短篇小说,以及对其他内容感兴趣,也欢迎点击下面的链接,效果不错哦,很多朋友都说好。

点击这里:超强写作提示词 以及 最强写作指导

效果如下


AI写作批改助手

雪花写作法

prompt自动优化

一文读懂4种AI Agent设计模式


原项目地址:

https://github.com/openai/openai-realtime-agents/blob/main/src/app/agentConfigs/voiceAgentMetaprompt.txt

草台AI
世界潮流 浩浩荡荡 顺之则昌 逆之则亡。AI来了!AIGC,LLM,大模型,规模效应,软件开发
 最新文章