拆解:智谱的「深度推理/多步搜索」

2024-10-10 23:39   广东  

如把 AI 当搜索引擎,很多时候,结果并不理想。

无他:AI 不会规划,也无法对结果进行检查和纠错

那么今天,我们一起来了解下:智谱这个「会反思的 AI 搜索」,是如何构建的




AI 通常怎么错


当你问 AI 一个问题,如:「今年诺贝尔物理学奖获得者 其中年轻的那位的出生地的今日天气」

通常情况下,AI 会给出错误答案,比如下面这个

很显然:这个答案是错的。实际上,AI 只检索到了获奖者的出生地,而天气纯靠猜。




AI 为何会犯错


看过之前文章(看完这篇,你也能做 AI 搜索:论「结构化输出」)的朋友都知道,AI 搜索实际上包含以下的固定流程:

  • 意图识别:将用户的提问,转化成一个搜索字段;

  • 联网检索:通过必应等工具,找到这个字段的对应信息

  • 整合回答:将找到的信息,连同用户的提问,一起返回给用户


而在上面的例子中,细细分析请求步骤,如下:

  • 意图识别:识别意图为「2024年诺贝尔物理学奖获得者 年轻者 出生地 2024年10月10日 天气」

  • 联网检索:搜索结果如下,发现关注点只在「诺贝尔物理学奖获奖者是谁」

  • 整合回答:由于缺少对应的天气信息,答案只能靠猜




AI 如何纠错


但实际上,我们期待一种怎样的 AI 搜索呢?

联网搜索,并支持多步检索(比如智谱清言里的这个智能体)

https://chatglm.cn/main/gdetail/659e54b1b8006379b4b2abd6?lang=zh


这时候我们看到,搜索的路径变了,成了:

  • 任务规划:将用户的提问,一个思考框架:如需解决某一问题,应步骤一、二、三、四...

  • 任务执行:每一具体步骤,需分别获得哪些信息(将重复多次):

    • 意图识别将步骤任务,转化成搜索任务

    • 搜集信息:通过搜索引擎,尝试搜集相关信息

    • 反思&调整后续:判定当前任务是否完成

      • 如完成:继续后面步骤

      • 如无法完成:换一种方式尝试完成

  • 整合回答:将找到的信息,连同用户的提问,一起返回给用户


具象一点,在「今年诺贝尔物理学奖获得者 其中年轻的那位的出生地的今日天气」这个任务中,问题被拆解成了:

  • 尝试搜集获奖者信息

    • 搜索:年诺贝尔物搜索2024年诺贝尔物理学奖获得者的信息

  • 尝试找到最年轻者的出生地

    • 搜索:搜索John J. Hopfield和Geoffrey E. Hinton的出生地

  • 查询出生地的当日天气

    • 搜索:搜索芝加哥和伦敦的今日天气

  • 总结上述信息

    • 2024年诺贝尔物理学奖的两位获得者是约翰·J·霍普菲尔德(John J. Hopfield)和杰弗里·E·辛顿(Geoffrey E. Hinton)。其中,杰弗里·E·辛顿是较年轻的获奖者,他出生于1947年12月6日,出生地是英国伦敦:

      • 天气状况:大部多云

      • 最高气温:14°C风向

      • 风速:东南偏南风,风速为15到30公里/小时



深度推理,是重要的

之前拆结果 o1:

o1 很强,但也有一些不够好的地方,比如:除了部分代码场景,并不实用

比如:不能联网,不能运行代码,等等。这些是问题,也是实打实的用户痛点。


智谱的这个更新,更类似「perplexity pro」,但更强大&实用。




0. 免费,不限量:这个很重要


1. 单次可以支持超过 100个 网页的并发搜索:针对用户的问题,可同时检索过100个网页,并基于此生成答案


2. 多级推理的思维链:能够解决日常生活中绝大多数的困难问题。


3. All Tools:在联网搜索和多级推理的过程中,调用python等工具,多方位解决问题(非常重要)。在处理项目的过程中,同时完成图像生成、代码执行、数据分析等多种复杂任务,自动调用代码解释器进行复杂的数学计算或文件处理、生成图表和PPT等格式的文件。

比如,在下面的场景中,综合了联网、列表格和代码处理:


赛博禅心
拜AI古佛,修赛博禅心
 最新文章