从0到1开发AI Agent（智能体）（三）| OpenAI API的快速入门

科技 2024-12-07 11:01 山西

-推荐关注-

-正文-

1. OpenAI API 聊天程序示例

2. OpenAI API 图片生成示例

AI Agent，即人工智能代理，一般直接叫做智能体。在是一种能够感知环境、做出决策并采取行动的系统。这些系统能够执行被动的任务，也能够主动寻找解决问题的方法，适应环境的变化，并在没有人类直接干预的情况下做出决策。

基于大模型的AI Agent开发常用框架包括：LangChain、LlamaIndex、OpenAI API

近两年火到天边基于大语言模型的聊天工具ChatGPT（于2022年12月推出），其背后的开发团队是OpenAI。OpenAI是一个专注于人工智能研究的公司，他们不仅开发了ChatGPT，还创造了许多令人惊叹的AI工具，像是能生成图片的DALL·E。

ChatGPT和 DALL·E 都为模型提供了网页版的对话界面以及一系列内置功能，例如集成 Bing 搜索功能、代码执行功能、数据分析功能。对于普通用户来说，这样的入口方便且直接。

不过，网页可不是我们访问 GPT模型的唯一方式。开发者可以借助OpenAI API，在程序中通过 API与模型进行交互。

官网：https://openai.com/index/openai-api/

一文说清楚什么是AI大模型

1. OpenAI API 聊天程序示例

1.1 首先要有一个API KEY

可以到OpenAI官网注册，https://openai.com/

如果网络原因连不上官网，可以找个代理服务如：OpenAI HK https://openai-hk.com/?i=47742
OpenAI HK见：
AI取经路，公众号：AI取经路10分钟解决国内不能访问OpenAI API的一个方案

1.2 安装openai依赖

pip install openai

1.3 代码：

from openai import OpenAI
# 当前参数是OpenAI的代理服务OpenAI HK的参数，如果使用官方接口，去掉参数即可
# 生成客户端对象
client = OpenAI(      
    api_key='hk-iwtbie1000cf1b4a91e427',
    base_url='https://api.openai-hk.com/v1'
)
# 获取返回对象
response = client.chat.completions.create(  # 聊天接口
    model="gpt-4o-mini",    # 模型名称
    response_format={       # 返回的格式类型
"type": "json_object"
    },
    messages=[       # 组织完整的对话历史
        {
"role": "system",
"content": "您是一个帮助用户了解鲜花信息的智能助手，并能够输出JSON格式的内容."
        },{
"role": "user",
"content": "生日送什么花最好?"
        },{
"role": "assistant",
"content": "玫瑰花是生日礼物的热门选择."
        },{
"role": "user",
"content": "送货需要多长时间?"
        },

    ]
)
# 打印完整的返回对象
print(response) 
# 打印返回的文本
print(response.choices[0].message.content)

1.4 返回对象格式

# 完整的返回对象
ChatCompletion(
    id='chatcmpl-Abczkrvv1B1pxjHVfspV3OJWeGpmu', 
    choices=[
        Choice(
            finish_reason='stop', 
            index=0, 
            logprobs=None, 
            message=ChatCompletionMessage(
                content='{"送货时间":"一般情况下，鲜花的送货时间取决于所在地区和花店的服务政策。通常情况下，城市内当天送达是比较常见的服务，但在高峰期或节假日可能需要提前预定。如果是在偏远地区，送货时间可能会更长，一般需要1-3天。建议提前确认具体的送货时间与花店。"}', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=None)
            )
    ], 
    created=1733531396, 
    model='gpt-4o-mini-2024-07-18', 
    object='chat.completion', 
    service_tier=None, 
    system_fingerprint='fp_04751d0b65', 
    usage=CompletionUsage(
        completion_tokens=88, 
        prompt_tokens=65, 
        total_tokens=153, 
        completion_tokens_details=CompletionTokensDetails(accepted_prediction_tokens=0, audio_tokens=0, reasoning_tokens=0, rejected_prediction_tokens=0), prompt_tokens_details=PromptTokensDetails(audio_tokens=0, cached_tokens=0)
    )
)

# 返回的文本
{"送货时间":"一般情况下，鲜花的送货时间取决于所在地区和花店的服务政策。通常情况下，城市内当天送达是比较常见的服务，但在高峰期或节假日可能需要提前预定。如果是在偏远地区，送货时间可能会更长，一般需要1-3天。建议提前确认具体的送货时间与花店。"}

{"送货时间":"一般情况下，鲜花的送货时间取决于所在地区和花店的服务政策。通常情况下，城市内当天送达是比较常见的服务，但在高峰期或节假日可能需要提前预定。如果是在偏远地区，送货时间可能会更长，一般需要1-3天。建议提前确认具体的送货时间与花店。"}

1.5 Chat接口描述`client.chat.completions.create`

endpoint地址：post https://api.openai.com/v1/chat/completions

1.5.1 请求参数说明

model参数

model参数指定了大模型的具体型号。除了代码中的gpt-4o-mini 之外，OpenAI公司还有多种模型可供选择。需要注意的是，在使用 chat.completions方法时，只能选择表格中列出的聊天模型。如果选择其他类型的模型，那么需要调用相应的 API。

OpenAI常见模型列表，截止到20241206

模型名称	类型	描述	参数
gpt-4o	聊天	高智能旗舰模型，适用于复杂的多步骤任务。GPT-4o 比 GPT-4 Turbo 更便宜、更快。目前指向`gpt-4o-2024-08-06`	上下文：128,000个token；知识截止到2023年10月
gpt-4o-mini	聊天	经济实惠且智能的小型模型，适用于快速、轻量级任务。GPT-4o mini 比 GPT-3.5 Turbo 更便宜且功能更强大。目前指向`gpt-4o-mini-2024-07-18`	上下文：128,000个token；知识截止到2023年10月
gpt-4-turbo	聊天	最新的具备视觉功能的 GPT-4 Turbo 模型。视觉请求现在可以使用 JSON 模式和函数调用。目前指向`gpt-4-turbo-2024-04-09`	上下文：128,000个token；知识截止到2023年12月
gpt-3.5-turbo	聊天	截至 2024 年 7 月，应使用`gpt-4o-mini` 代替`gpt-3.5-turbo` ，因为它更便宜、功能更强大、多模态，且速度相同。`gpt-3.5-turbo` 在 API 中仍然可用	上下文：16,385个token 知识截止到2021年9月
dall-e-3	图像	DALL·E 是一个 AI 系统，可以从自然语言描述中创建逼真的图像和艺术。DALL·E 3 目前支持根据提示创建具有特定尺寸的新图像	图像大小可以是 1024x1024、1024x1792 或 1792x1024 像素

参考：https://platform.openai.com/docs/models

messages参数

代码中的参数 messages 表示消息数组，也是与聊天模型交互的主要部分。每条消息包含一个角色(role)和一段内容(content)。这里的角色指定了消息的发送者或类型，通常有以下几种：

"system" : 代表系统级的指令或信息，通常用于设置聊天的背景或上下文。例如，{"role":"system"，"content":"您是一个帮助用户了解鲜花信息的智能助手，并能够输出 JSON 格式的内容。"}，这条消息设定了智能助手的角色和输出格式。
"user" : 代表用户的输入。这是模拟用户与智能助手对话的部分。例如{"role":"user"，"content":"生日送什么花最好?"}表示用户询问什么样的花作为生日礼物最合适。
"assistant" : 代表智能助手的回复，通常是模型根据上下文生成的回答。例如{"role":"assistant","content":"玫瑰花是生日礼物的热门选择。"}，表示智能助手建议送玫瑰作为生日礼物。

在这个代码示例中，通过"system"、"user" 和 "assistant" 的一系列角色消息模拟了一个用户与智能助手关于鲜花信息的对话场景。用户提出问题，智能助手基于之前的系统指令(定义助手的角色和能力)和对话历史进行回答。借助这种方式，可以模拟出较为真实的聊天体验。

response_format参数

代码中的response_format={"type":"json_object"}指定响应格式为JSON对象，这意味着模型的响应将以 JSON 格式返回，以方便解析和使用。

其他完整参数

见：https://platform.openai.com/docs/api-reference/chat/create

1.5.2 返回参数说明

id 参数

聊天完成的唯一标识符

finish_reason参数

模型停止生成标记的原因。stop 表示模型达到了：自然停止点或提供的停止序列，length 表示达到了请求中指定的最大标记数，content_filter 表示遇到内容过滤器标志而省略了内容，tool_calls 表示模型调用了工具，或function_call （已弃用）表示果模型调用了函数

content参数

消息文本内容

model 参数

用于聊天的模型型号

其他完整参数

见：https://platform.openai.com/docs/api-reference/chat/object

2. OpenAI API 图片生成示例

大模型不仅能输出文本，而且拥有多模态的能力,OpenAI公司拥有 DALL·E可以生成图片。因为要展示图片，因此我们要安装Jupyter Notebook环境

Jupyter Notebook: 一个“笔记本”工具：就像普通笔记本用来写笔记一样，Jupyter Notebook 是一个数字笔记本，既可以写代码，也可以写文字，还能画图、做表格。它可以直接显示绘图结果（比如数据图表、统计图），适合用来做数据分析和机器学习。
这里使用他的目的是：在笔记本中(ipynb文件)运行代码，并直接显示出代码生成的图片

安装Jupyter Notebook依赖：pip install jupyter notebook

新建hello-openai.ipynb文件

# hello-openai.ipynb
from openai import OpenAI

client = OpenAI(
    api_key='hk-iwtbie10b4a91e427',
    base_url='https://api.openai-hk.com/v1'
)

# 请求DALL-E生成图片
response = client.images.generate(   # 图片生成接口，见接口秒速
  model="dall-e-3",
  prompt="电商花语秘境的新春玫瑰宣传海报，配上文案",
  size="1024x1024",
  quality="standard",
  n=1,
)

# 获取图片URL
image_url = response.data[0].url

# 读取图片
import requests
image = requests.get(image_url).content

# 在Notebook中显示图片
from IPython.display import Image
Image(image)

这里的 images.generate 方法调用 DALL·E3模型来创建一张图片。指令的目的是生成一张尺寸为 1024 像素 x1024 像素的电商花语秘境的新春玫瑰花宣传海报。之后从生成的响应中提取图片的 URL，这是图片存储位置的网络链接。然后，使用Python的requests库从URL获取图片内容，并利用IPython的lmage函数在Jupyter Notebook 中显示这张图片

在截图中可以看到，生成的图片效果还是非常不错的

Images接口描述 `client.images.generate`

endpoint地址：post https://api.openai.com/v1/images/generations

参数说明：

见：https://platform.openai.com/docs/api-reference/images/create

参考：

1. 一文说清楚什么是AI Agent(智能体)

2. 从0到1开发AI Agent（智能体）（一）| 基于大模型的AI Agent技术框架

3.《大模型应用开发动手做AI Agent》

往日文章：

从0到1开发AI Agent（智能体）（二）| 智能体推理引擎ReAct框架的快速入门
10分钟解决国内不能访问OpenAI API的一个方案
4 个关键的 AI 趋势 | 吴恩达在 Snowflake Build 2024 上的演讲大纲
智能体（AI Agent）的5个能力级别将带我们走向何方
从0到1开发AI Agent（智能体）（一）| 基于大模型的AI Agent技术框架

--END--

AI取经路

踏上取经路，比抵达灵山更重要！ AI技术、 AI知识、 AI应用、人工智能、大语言模型

最新文章

谷歌对智能体的理解：白皮书《Agents》

从0到1开发AI Agent（智能体）（八）| 智能体3：通过Llamalndex实现检索增强生成（RAG）

入门GPT（二）| 词袋模型（Bag of Words）辅助提升餐厅满意度

RAG怎么面对用户的4级查询难度？微软给出方案！

入门GPT（一）| N-Gram带你了解自然语言处理（2）代码实现

入门GPT（一）| N-Gram 带你了解自然语言处理（1）

国产之光，DeepSeek V3大模型既便宜又好用，惊艳世界AI圈

LangChain实战 | OutputParser：让大模型输出从 “鸡肋” 变 “瑰宝” 的关键！

LangChain实战 | LangGraph 让你的 AI 项目从 “好” 变 “卓越”

Claude官方Anthropic建议：构建高效智能体 (Building effective agents)

从0到1开发AI Agent（七）| Plan-and-Execute 如何解决AI复杂任务

为什么提示词总出错？使用思维链（CoT）提升效果高达 78%！

10分钟了解大模型应用全貌 : 大模型应用架构（LLM application architecture）

CNNIC中国互联网络信息中心重磅发布《生成式人工智能应用发展报告（2024）》

怎么说大模型才会听：提示工程神器之少样本提示(Few-Shot Prompting)

怎么说大模型才会听：零样本提示(Zero-Shot Prompting)

从0到1开发AI Agent（智能体）（六）| 智能体1 ：通过LangChain中的ReAct框架实现自动定价

LangChain实战 | Tool Calling ：让AI真正动起来的关键技术

人工智能小白到高手：大模型通过 Function calling 沟通外部世界

斯坦福大学发布！《全球人工智能实力排行榜》 - 中美 AI 赛跑

一文说清楚什么是大模型LLMs的Token,全面了解钱的流向

一文说清楚什么是多模态大模型，与大模型有什么区别

人工智能小白到高手：怎么都绕不开的独热编码（one-hot encoding）

从0到1开发AI Agent（智能体）（五）：LlamaIndex 极速上手攻略

人工智能小白到高手：什么是线性回归

数字智能会取代生物智能吗？AI 教父 Geoffrey Hinton 你怎么看

从0到1开发AI Agent（智能体）（四）| LangChain 的快速入门

加速让企业落地"生成式AI"，53%的公司已经领先一步！

从0到1开发AI Agent（智能体）（三）| OpenAI API的快速入门

OpenAI 12天发布会狂欢开始了！第一天的重磅发布

给小朋友解释什么是人工智能、机器学习、深度学习、神经网络

人工智能深度学习的进化史：一场横跨80年的脑洞之旅

从0到1开发AI Agent（智能体）（二）| 智能体推理引擎ReAct框架的快速入门

10分钟解决国内不能访问OpenAI API的一个方案

AI时代，Java程序员不能不知道的两个框架

4 个关键的 AI 趋势 | 吴恩达在 Snowflake Build 2024 上的演讲大纲

智能体（AI Agent）的5个能力级别将带我们走向何方

从0到1开发AI Agent（智能体）（一）| 基于大模型的AI Agent技术框架

一文说清楚什么是AI大模型

为AI而生的向量数据库 - milvus(三) | 使用（1）

一个程序员的感恩节独白：写给那些代码里的温暖

人工智能小白到高手：Sentence-Transformers

一文说清楚人工智能的嵌入（Embedding）是什么

未来的手机是什么样子，AI赋能的全新体验，Mate 70系列的智慧亮点

为AI而生的向量数据库 - milvus(二) | 单机Standalone安装

人工智能小白到高手：余弦相似度（Cosine Similarity）的简单理解

Docker在Windows环境（WSL2）的安装

为AI而生的向量数据库 - milvus(一) | milvus是什么

从制造到医疗，行业大模型正重塑世界！- 腾讯研究院发布《行业大模型调研报告》

一文说清楚什么是AI Agent(智能体)

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

从0到1开发AI Agent（智能体）（三）| OpenAI API的快速入门

1. OpenAI API 聊天程序示例

1.5 Chat接口描述client.chat.completions.create

1.5.1 请求参数说明

model参数

messages参数

response_format参数

其他完整参数

1.5.2 返回参数说明

id 参数

finish_reason参数

content参数

model 参数

2. OpenAI API 图片生成示例

Images接口描述 client.images.generate

1.5 Chat接口描述`client.chat.completions.create`

Images接口描述 `client.images.generate`