吴恩达年度AI复盘:Agent崛起、价格暴跌、模型瘦身,2024 AI 狂飙!
各位朋友,2024年已然过去,AI领域又经历了飞速发展的一年。AI教父吴恩达在近日的总结中指出,虽然底层AI技术在过去两年中加速发展,但应用领域的进步速度更快!
核心观点速览:
• AI发展迅猛: 2024年AI技术取得了巨大进展,速度更快、成本更低、模型更小、多模态能力更强、推理能力更好,开源模型也层出不穷。 • 应用落地加速: 基于GPT-4(2023年3月发布)的诸多应用场景,如客户服务、问答系统、流程自动化等,在2024年迎来了爆发式增长。 • 创新是关键: 只有保持警惕,抵制那些阻碍创新的力量,才能保持甚至进一步加速AI的发展。 • 学习不落后: 技术变革日新月异,每个人都必须不断学习,才能保持竞争力并做出贡献。 • AI的时代: AI是当前世界最重要的技术变革,我们都应该积极参与,利用它来改善自己和他人的生活。
接下来,让我们一起回顾2024年AI领域的五大关键进展,看看这一年有哪些值得我们关注的重大变化:
1. Agent 崛起:AI从被动执行到主动决策
2024年,“Agent” (智能体) 成为AI领域新的流行词。AI不再是被动地执行指令,而是像智能助手一样,可以自主思考、利用工具、做出决策,以达成特定目标。
具体表现:
• 多智能体框架: 涌现了许多帮助开发者构建Agent工作流的工具,如微软的Autogen、AG2、CrewAI、LangChain的LangGraph等。这些框架可以协调多个AI智能体之间的协作。 • IDE集成: 集成开发环境也开始应用Agent工作流来生成代码。例如,Devin、OpenHands可以通过自然语言指令生成代码原型。 • 模型支持: 许多LLM厂商也开始支持工具使用和函数调用,如Anthropic的Claude 3.5 Sonnet可以直接控制用户的电脑,OpenAI的o1模型、DeepSeek-R1、Google Gemini 2.0 Flash等模型都开始运用Agent循环进行推理。
技术基础: 这些进步背后,离不开Prompt工程的进步,如:
• 思维链 (Chain of Thought):让LLM逐步思考,增加推理过程的透明度。 • 自洽性 (Self-consistency):让模型生成多个响应,选择最一致的答案,提高结果准确性。 • ReAct:让推理和行动步骤交替进行,提高智能体完成复杂任务的能力。 • Self-Refine:让智能体反思自身输出,不断改进。 • Reflexion:让模型行动、评估、反思、重复,类似强化学习的过程。 • 测试时计算 (Test-time compute):为推理过程分配更多算力,提高性能。
未来展望: Agent时代的到来,将使AI系统更加高效、个性化,无论基础模型如何进步,Agent工作流都将成为AI应用的关键。
2. 价格暴跌:AI服务进入“白菜价”时代
2024年,模型厂商和云服务提供商之间的激烈竞争,导致AI模型的使用成本大幅下降。这对于AI应用的普及无疑是重大利好。
具体表现:
• OpenAI降价: 从2023年3月到2024年11月,OpenAI模型token单价降幅高达90%。 • 开源模型: 开源模型的出现,降低了云服务商的成本,他们可以提供高性能模型而无需承担开发或授权费用,如Llama 3 70B的平均价格只有0.78/0.95 美元每百万个token。 • 中国厂商: 中国科技巨头纷纷大幅降价,如DeepSeek、阿里巴巴、百度、字节跳动等,甚至有部分模型免费使用。 • 闭源模型: 闭源模型的价格战同样激烈,如OpenAI的GPT-4o和GPT-4o mini,价格一降再降。Google的Gemini 1.5 Pro 和 Gemini 1.5 Flash 也大幅降价,甚至Gemini 2.0 Flash免费试用。 • 专业芯片: 拥有专业芯片的初创公司(如Cerebrus、Groq、SambaNova)能够更快速、更便宜地服务于开源模型。
背后原因:
• 开源力量: AI社区极力抵制限制开源模型的法规,开源模型在降低价格方面发挥了重要作用。 • 市场竞争: 激烈的竞争促使各家厂商不断降价,以吸引用户。
未来展望: 价格下降是技术生态系统健康的标志,虽然顶级模型可能依然价格较高,但市场正在逐渐向“每百万token只需几美分”的时代迈进。
3. 生成式视频爆发:AI视频制作触手可及
2024年,生成式视频技术蓬勃发展,各种强大的模型层出不穷,为我们带来了全新的视频创作体验。
具体表现:
• 模型迭代: 几乎所有主流模型都实现了惊人的进步,生成了高度逼真、细节丰富的场景,同时在分辨率、速度、输出时长等方面大幅提升。 • 功能多样: 出现了各种文本到视频、图像到视频、视频到视频的模型,一些模型专门针对社交媒体视频制作。 • 典型代表: OpenAI的Sora、Runway Gen 3 Alpha系列、Adobe Firefly Video、Meta的Movie Gen等都展现出强大的视频生成能力。 • 中国力量: 中国的Kling AI、PixVerse、Jimeng AI以及字节跳动的PixelDance和Seaweed等模型,专注于制作社交媒体视频。
行业影响:
• 电影行业: AI视频正在重塑电影行业,一些电影人认为,AI视频可能会在几年内颠覆传统电影制作模式。 • 后期制作: AI视频已经开始应用于后期制作,大幅缩短编辑时间,并提升制作效率。
未来展望: 虽然生成式视频取得了巨大进步,但依然存在诸多挑战,如物理和几何跟踪、人物和场景的一致性、长时间视频生成等,未来仍有很大的提升空间。
4. 模型小型化:在手机上运行AI成为现实
多年以来,AI模型不断增大。但在2024年,一些流行的LLM小到可以在智能手机上运行。
具体表现:
• 模型家族: AI公司开始推出模型家族,包括小型、中型、大型模型,如微软的Phi-3、谷歌的Gemma 2、Hugging Face的SmolLM等。 • 小型化技术: 知识蒸馏、参数剪枝、量化等技术使小型模型具有更强的能力。 • 应用场景: 小型模型不仅具有高性能、高速度、低成本,还能在低功耗硬件上运行,这在许多场景下具有竞争优势。
技术基础:
• 参数剪枝: 1989 年就出现了,选择性地删除模型的权重,降低模型大小,增强模型的泛化能力。 • 量化: 1990年出现,减少了模型参数占用的位数。2010年后,量化技术随着神经网络的流行而复苏。 • 知识蒸馏: 2006年提出,利用多个模型的优点训练一个模型,2015年由Hinton等人改进,推广了该方法,并引入“知识蒸馏”这一术语。 • 数据为中心: 现在的模型训练集都经过精心的清理和策划,通过提高数据质量来获得更高的模型性能,这反映了数据中心AI的思想。
未来展望: 小型模型极大地扩展了成本、速度和部署选项。随着研究人员找到在不牺牲性能的情况下缩小模型的方法,开发者将有更多方法构建有盈利能力的应用,并能够将AI的处理能力部署到互联网的边缘。
5. 另类合作:避开收购的“新常态”
为了获取尖端技术和人才,大型AI公司开始采取创新的合作方式,而不再是直接收购初创公司。
具体表现:
• 新型合作: 微软、亚马逊、谷歌等科技巨头与Inflection AI、Adept AI、Covariant和Character.ai等AI初创公司达成合作协议,他们通过投资、授权、招聘等方式,获得了这些初创公司的技术和人才,而无需直接收购这些公司。 • 各取所需: 大型公司获得了顶尖人才和成熟技术,降低了被监管部门阻碍的风险。初创公司则获得了资金回报,可以摆脱模型研发的高昂成本。
背后原因:
• 监管压力: 传统收购方式面临反垄断监管机构的严格审查。 • 合作灵活: 新型合作方式更灵活、更省时,也规避了收购带来的复杂问题。
未来展望: 这种新型合作模式或许将成为科技巨头获取技术和人才的“新常态”,但即使是这种模式也并非完全不受监管约束,未来仍可能面临监管部门的调查。
结语
2024年AI领域的发展可以用“日新月异”来形容,无论是技术进步、应用落地、价格下降,还是合作模式的创新,都让我们看到了AI的巨大潜力。吴恩达也表示,他对2025年在AI技术和应用方面取得更快的进步充满信心。
正如他所说,AI是当前世界最重要的技术变革,我们都应该积极参与其中,不断学习和探索,利用AI来改善自己和他人的生活。
新的一年,让我们一起拥抱AI,共同见证科技带来的美好未来!
原文:
https://www.deeplearning.ai/the-batch/issue-281/
如果您想要让大模型写出优质的短篇小说,以及对其他内容感兴趣,也欢迎点击下面的链接,效果不错哦,很多朋友都说好。
点击这里:超强写作提示词
效果如下