探索GLM4-ALLTools:全能AI工具箱,释放开发者潜能

文摘   2024-06-28 17:53   湖北  

了解小智的粉丝相信对Zhipu-AI都不陌生,在往期LangChain教程里,小智已经通过GLM4的超强能力搭建了众多的Agent智能体应用。最近AI又悄摸上线了GLM-4-Alltools API能力,今天我就带大家来盘一盘!

GLM-4更新了什么?

老规矩,先放大纲,带大家看看GLM-4-Alltools API更新了哪些功能。如图所示,以下就是Alltools所有新增的能力。

我将其分为了四块,一站式检索,一站式智能编程,企业私域增强,多模态四个部分。

想要用上这些新的功能也十分简单,只需要在调用GLM-4 API时,选取glm-4-alltools模型,并在tools参数里加上你想要启用的工具(如web_browser),在API调用时,平台会基于你的问题以及选择的工具自动拆解问题,工具调用,一次性解决复杂的用户需求。接口详细说明大家可以到MAAS平自行获取。

  • https://bigmodel.cn/

可能只看这些单项的功能,大家没有太多感触,似乎各类agent都已实现。接下来小智就带大家用两个实际案例来体会一下,当API内置了如此全能的工具箱,会碰撞出什么样的火花!

一站式检索模型直接帮你搞定

GLM-4-Alltools API 为开发者内置了实时联网搜索功能,使得开发者无需复杂的意图识别和检索参数提取。

当模型识别到问题解决需要使用搜索引擎时,会主动调用内置的检索能力,提供实时且全面的搜索结果。完成搜索后,内置的网页浏览工具能够打开并浏览网页内容,基于网页内容进行更深入的分析。同时结合强大的自我规划能力,以及内置的代码沙箱绘图等工具,API能通过一次交互就完成复杂的任务处理。

示例:给我查询上海本周日的天气情况,根据天气情况和上海的著名地标,画一张高质量的城市风景海报。

  • 按以上需求,如果使用基础的大模型API,在接收到用户提问后,至少要进行COT分解,搜索引擎检索,检索页面读取,绘图API调用,并整体通过代码完成整体流程开发。
  • 但是Alltools API在接口内部已经内置了检索、网页浏览以及绘图的工具,并且接口本身具体针对复杂需求的分解能力,所以使用时,我们只需要提出问题,并在工具参数中加入web_browser以及drawing_tool,就能轻松完成以上示例。
Alltools API示例

上图示例代码已上传github,有兴趣的小伙伴可以到如下地址自取。

  • https://github.com/q2wxec/langgraph-demo/tree/master/glm4

一站式智能编程与安全沙盒体验

GLM-4-Alltools API 内置的智能编程助手(Code Interpreter)能够准确理解自然语言描述的编程需求,自动生成代码片段来解决实际问题。这对于开发者来说,无疑是一个极大的便利。

同时为了保证代码的安全性,Alltools API提供了安全代码沙盒(Sandbox),可以在其中模拟真实环境中的代码执行结果,一次性的需求可以直接通过沙箱获取最终结果,复杂需求则可确保代码在正式环境中运行时的安全性稳定性

示例:计算[5,10,20,700,99,310,978,100]的P95,P99数值,以及平均值和方差。

  • 按以上需求,如果使用基础的大模型API,在接收到用户提问后,执行代码输出提示词引导,代码输出及配套环境准备,代码执行并依据异常情况迭代输出,最终整体通过代码完成整体流程开发。
  • 但是Alltools API在接口内部已经内置了智能编程助手与安全代码沙盒,并且接口本身具体针对复杂需求的分解能力,所以使用时,我们只需要提出问题,并在工具参数中加入code_interpreter,将sandbox设置为auto,代码生成后将自动推送到线上的沙箱环境执行,并通过LLM输出最终结果。

结语

GLM-4-Alltools API 为开发者提供了一个功能强大、易于使用、安全可靠的AI工具箱,可以帮助开发者快速构建各种AI应用。相信在不久的将来,GLM-4-Alltools API 将会成为开发者不可或缺的助手,助力开发者释放潜能,创造更多可能性。


AI小智
AI认知架构师,让我们一起用AI改变世界!