4 个关键的 AI 趋势 | 吴恩达在 Snowflake Build 2024 上的演讲大纲

科技   2024-12-03 10:00   山西  

-推荐关注-

-正文-

      各位好!非常感谢大家的参与。对技术构建者来说,现在是一个绝佳的时代。我很高兴再次来到 Snowflake Build。今天,我想与大家分享我对人工智能(AI)最重要机会的一些看法。你可能听我说过一句话:“AI 就像电力一样。”这是因为,作为一种通用技术(类似于电力),AI 有着无数的应用场景。如果有人问你:“电力能用来做什么?” 这个问题很难回答,因为电力几乎无处不在。同样,新兴的AI技术正在为我们创造一个庞大的机会空间,能够开发以前无法实现的应用。

      经常有人问我:“AI最大的机会在哪里?” 我对AI技术栈的理解是这样的:在最底层,是半导体技术。在其上是云基础设施。当然,再往上是各种基础模型训练工具和模型本身。大众和媒体的注意力通常集中在技术栈的这些层级,尤其是生成式AI等新技术层面。这本身没有问题,但我认为还有一个层级值得更多关注,那就是应用层

      应用层是我们创造价值和收入的地方,它最终支持整个技术栈的发展。因此,我花了很多时间思考AI的应用,因为我相信那里是构建新事物的最佳机会所在。


      过去几年中,尤其是在生成式AI的推动下,机器学习模型开发的速度显著加快。例如,构建一个情感分类器(用于分析文本情感正面或负面的工具)以进行声誉监控。使用传统的监督学习方法,通常需要一个月时间收集标注数据,再用几个月训练模型,之后还需额外时间部署平台。总体来看,即使是最顶尖的团队,构建有价值的AI系统通常需要6到12个月。

      但生成式AI让某些类别的应用开发可以在数日内完成。例如,编写一个提示(prompt)只需几天时间,快速部署后,能够将以前需要数月完成的应用缩短到10天以内。这为快速实验、原型设计和快速推出AI产品打开了激动人心的可能性。

      快速实验已成为创新的更佳路径。过去,当开发一项产品需要6个月时,团队必须进行广泛的市场研究、验证用户需求并仔细规划。但现在,快速行动的AI团队可以在一个周末开发20个原型,然后评估哪些有效。如果有18个失败也没关系,只需坚持那2个成功的即可。这种快速迭代的方式正在解锁新的用户体验创造机会。

      然而,这一趋势也带来了新的挑战。例如,评估(或称“evals”)成为了一个瓶颈。在监督学习中,收集10,000个训练数据的同时,也可以顺便收集1,000个测试数据,几乎没有额外成本。但对于基于大语言模型的应用,往往没有现成的训练数据。如果测试需要创建1,000个示例,便成为一个显著的瓶颈。因此,开发流程从过去的顺序构建与数据收集,转变为并行进行。


      虽然机器学习原型开发的速度比以往任何时候都快,但软件开发生命周期的其他部分(包括设计、软件集成、部署和运营)并没有以相同的速度加速。这使得组织面临压力,要求加快这些流程以匹配机器学习开发的速度。

     “快速行动、打破常规”这一口号因为带来了负面后果而名声不佳。但这并不意味着我们不应该快速行动。更好的方式是“快速行动,同时负责”。许多团队现在能够快速开发原型、稳健评估并负责任地迭代,以更快的速度构建系统,同时不牺牲安全性或质量。

      在技术趋势方面,我最兴奋的是智能体AI工作流。如果你问我当前最重要的AI技术是什么,我会说是智能体AI。当我今年初提出这一点时,这一想法还有些争议,但现在“AI智能体”一词已经被广泛接受。

      从技术角度看,智能体工作流的核心在于迭代式流程:AI先生成一个草稿,再进行网络研究,撰写初稿,批判修改,然后重复这一过程。与一次性输出相比,这种方法虽然更耗时,但效果显著提升。

      例如,在我合作的一些团队中,智能体工作流被应用于处理法律文件、辅助医疗诊断或管理合规性文档。相比传统方法,这种迭代流程能够显著提高结果的质量。

      在某些基准测试中,智能体工作流的优越性得到了验证。例如,在OpenAI的人类评估基准中解决编程难题时,GPT-3.5的准确率为48%,GPT-4提高到67%,而GPT-3.5结合智能体工作流后跃升至95%。这是一个显著的提升。

智能体工作流有四种主要设计模式:

  1. 反思(Reflection):模型迭代地批判和改进自己的输出。例如,生成代码、审视代码、然后根据反馈改进,这一过程通常可以提升性能。

  2. 工具使用(Tool Use):大语言模型生成并执行API调用、进行网络搜索或其他自动化操作,从而扩展了它们可以执行的任务范围。

  3. 规划(Planning):AI将复杂任务分解为一系列子任务并按顺序执行。这种方法对复杂工作流尤为有用。

  4. 多智能体协作(Multi-Agent Collaboration):模型扮演多个角色(如编码员、批评者)或模拟多个“智能体”之间的协作,以实现更优的结果。


      智能体工作流在多模态AI领域的应用尤其令人兴奋,在这里,模型不仅能处理文本,还能分析图像、视频等多种数据类型。例如,模型可以逐步分析图像,检测人脸、识别物体,并迭代地生成详细输出。

      总结来说,AI技术栈正在演进,出现了一个新的智能体编排层,使得开发者能够更轻松地构建强大的应用。特别是视觉AI的崛起,为企业从以前未开发的图像和视频数据中提取价值提供了新的机会。

最后,我认为以下四个AI趋势最值得关注:

  1. 由半导体和软件进步推动的更快的token生成。
  2. 大语言模型不仅优化了回答问题,还优化了工具使用和迭代工作流。
  3. 数据工程在管理无结构数据(如文本、图像、视频)中的重要性日益增长。
  4. 视觉AI革命的到来,将为从视觉数据中提取价值打开巨大的潜力。

      这是一个激动人心的时代,生成式AI促进了更快的实验,而智能体AI则扩展了我们的可能性。许多以前不可能的应用,无论是视觉AI还是其他领域,现在都可以实现。


往日文章:

--END--

AI取经路
踏上取经路,比抵达灵山更重要! AI技术、 AI知识 、 AI应用 、 人工智能 、 大语言模型
 最新文章