云计算一哥的生成式AI之道：Choice Matters

科技 2024-12-18 18:28 北京

允中发自凹非寺
量子位 | 公众号 QbitAI

引言：AI大模型，并不是一个赢家通吃的市场。

自OpenAI在2022年发布ChatGPT以来，无论是科技巨头还是初创公司，各个玩家可以说是纷纷加大投入，试图在模型性能上超越彼此。

似乎追求单一、性能卓越的AI大模型已然成为一种趋势，各类Benchmark上的夺冠也好似一张得到市场认可的入场券。

然而在如此打法成为主流的同时，一个在AI大模型时代以来一直看似低调，也鲜有大声量地高喊“大模型性能第一”的科技巨头，却在时隔两年多之久，以截然不同的方式在大模型市场里惊艳亮相。

它就是云计算一哥——亚马逊云科技。

对于亚马逊云科技在AI大模型时代的定位，目前有一种非常贴切的比喻，叫做“沉睡的雄狮”。

之所以如此，是因为亚马逊云科技此前几乎是以“工厂模式”来推动大模型的发展，在业界声响最大的便是集成各路大模型的Amazon Bedrock。

即便在早期有发布过自研大模型Titan，但有一说一，似乎也是在大模型飞速迭代的浪潮中被淹没。

然而，正当大众以为亚马逊云科技在AI大模型时代会持续扮演一个“工厂”角色之际，就在前不久自家的年度盛宴re:Invent 2024中，它却高调发布了全新的基础模型——Amazon Nova系列。

而且是一口气六款模型，涵盖文本对话、图片生成和视频生成，并且也罕见地把与各类模态主流玩家的PK测评成绩直接亮了出来。

以视频生成模型Amazon Nova Reel为例，效果是这样的：

于是乎，为何在沉寂两年后才会有此动作？亚马逊云科技的打法又是否能符合市场发展？……

种种问题，亟待回答。

亚马逊的“AI步法”：Choice Matters

其实在今年亚马逊云科技的re:Invent中，若是一定要提炼一个关键词，那么Choice（选择），无疑就是最抢眼的那一个。

展开这个关键词，则正是“云计算一哥”在AI大模型时代下的打法：

会做选择，比拥有单一强大的大模型更为重要。

这是因为在亚马逊云科技看来，大模型市场并不是一个赢家通吃的市场；这就与其它公司形成了鲜明对比。

然而，亚马逊选择了一条不同的道路，通过其Bedrock等工具支持来自多个提供商的不同模型，而不是仅仅专注于构建自己的强大模型。

而这种背后蕴含“没有一个模型可以一统天下”的模式似乎也正在被市场所接纳。

根据Menlo Ventures的报告，公司通常在其AI服务中使用3个或更多的基础模型，根据不同的用例或结果路由到不同的模型。

这种趋势表明，即使是市场份额佼佼者的OpenAI，也面临着来自其他采用多模型策略的公司的挑战。

同样是根据Menlo Ventures的报告，一个较有说服力的数据是这样的：

采用亚马逊云科技模式的Anthropic在AI模型市场的份额翻倍至24%，而OpenAI的份额从50%下降到34%。

不过与此同时，自身拥有先进的AI大模型同样也有助于亚马逊云科技吸引更多的AI开发者。

虽然早期亚马逊云科技所推出Titan并没有在大模型圈里泛起太大的浪花，但这一次的Nova系列，确实是以其效果和实力博取了不小的关注。

而这一切的背后，依旧是贯彻亚马逊云科技的根本问题，即客户有所需要。

因此，亚马逊云科技在大模型时代下的“AI步法”就非常清晰了——

为客户提供“多快好省”的选择权，而不是“一统天下”的市场主导权。

那么接下来的一个问题是：

提供了怎样的AI选择权？

就在今天刚结束的re:Invent 2024中国行全国巡展北京站活动中，亚马逊云科技大中华区产品总经理陈晓建对这一问题做了再次的回顾。

△亚马逊云科技大中华区产品总经理，陈晓建

在短短90分钟的主题演讲中，露出的“AI可选项”多达30多个，平均下来就是每三分钟一个！

纵观整场活动，最直观的感受，就是这些回顾的“全新发布”涵盖了整个生成式AI的全周期——

从最底层的基础设施，到中间的模型服务，再到顶层的AI应用，是属于全栈的那种。

而之所以如此，陈晓建在现场做出了如下解释：

我们不仅在云的核心服务层面持续创新，更在从芯片到模型，再到应用的每一个技术堆栈取得突破，让不同层级的创新相互赋能、协同进化。
我相信，只有这样全栈联动的大规模创新才能真正满足当今客户的发展需求，加速前沿技术的价值释放，助力各行各业重塑未来。

“全新发布”数量虽然惊人，但按照生成式AI各层级来看脉络也是较为清晰，可以分为五个大亮点：

计算
存储
数据库
分析
AI推理

那么接下来，我们就来再次深入回顾下今年re:Invent中的那些高光时刻。

新款自研基础模型

首先，我们先来看下“AI推理”部分的产品，或许也是大家最感兴趣、最有感知的一个内容——大模型。

亚马逊云科技所发布的新款自研基础模型，名曰Amazon Nova，是有一点点震撼在身上的。

整体来看Amazon Nova共有四个“杯型”，它们分别是：

Amazon Nova Micro：仅限文本对话，主打一个低价格和低延迟；
Amazon Nova Lite：低成本的多模态大模型，处理图像、视频和文本输入的速度极快。
Amazon Nova Pro：高性能的多模态大模型，精度、速度和成本最佳“配方”，可处理广泛的任务。
Amazon Nova Premier：亚马逊最强多模态大模型，可处理复杂的推理任务，也可用于蒸馏客户定制化的模型。

其中一大亮点便是成本大幅降低。

据了解，在各自智能类别中，Amazon Nova Micro、Lite和Pro应用成本比“模型工厂”Amazon Bedrock中表现最佳的模型至少降低75%，同时也是Amazon Bedrock中对应类别速度最快的模型。

前三者已经上架亚马逊云科技的Amazon Bedrock，而Premier版本则将于2025年第一季度推出。

除此之外，还有Amazon Nova Canvas，主打的是图像生成，用官方的话来说，是达到了“State-of-the-art”（最先进）的水平。

在现场，陈晓建也展示了与DALL·E 3和Stable Diffusion Large 3.5的评估测试上的比较，图像质量等维度上均胜出。

在图像生成之后，亚马逊云科技还发布了视频生成模型——Amazon Nova Reel。

据了解，目前6秒钟时长的视频生成已经正式可用，2分钟版本的也在路上了。

同样的，Amazon Nova Reel与Runway家的Gen-3 Alpha之间的评测比试结果：视频质量胜率61.4%、视频连贯性胜率71.6%。

但这还不算完，Amazon Nova的下一步也已披露——

不仅要Speech-to-Speech，更要Any-to-Any！

一切皆可生成，是值得期待一波了。

而作为承载它们的“模型工厂”Amazon Bedrock，这一次也有不少的升级动作。

首先就是在模型的选择上，新增了多个choices，例如首家提供Luma AI和poolside模型，以及更新的Stability AI最新模型等。

其次，全新发布的Amazon Bedrock Marketplace，可以为客户提供100多个热门、新兴及专业模型。

还有Amazon Bedrock Knowledge Bases，现在支持可以支持GraphRAG等知识库功能增强数据利用能力。

在性能方面，Bedrock还推出了低延迟优化推理，由此，用户可以在使用最先进的大模型基础上，还享受卓越的推理性能。

值得一提的是，Llama 405B和Llama 70B低延迟优化版本，在亚马逊云科技上展现出超越其他云提供商的出色表现。

最后，通过自动推理检查功能和多智能体协作等创新，进一步增强AI安全性并推动智能体发展。

Amazon Q Developer则是引入了三款先进的智能体。

它们能够自动执行单元测试、生成文档和进行代码审查，同时通过与GitLab的深度整合，拓宽了应用范围。

此外，它还推出了新的转型特性，旨在加快Windows.NET、VMware和大型机工作负载的迁移与现代化进程，有效减少转型周期和成本。

同时，Amazon Q Business和Amazon Q in QuickSight的洞察力得到了加强，简化了复杂工作流程自动化的实现方法。

云计算，也全面升级

说完大模型，我们再来看下亚马逊云科技的“老本行业务”——云计算。

这次升级主要围绕三大核心领域展开：计算（Compute）、存储（Storage） 和数据库（Database）。

每一项都可以说是展现出了前所未有的性能提升与成本优化。

在计算（Compute）层面，亚马逊云科技推出了性能全面升级的Amazon EC2 Trn2实例。

Trn2实例搭载第二代Trainium芯片（Trainium2），相比上一代Trn1，性能提升如下：

训练速度提升4倍，显著缩短模型训练时间，助力企业更快落地AI应用；
内存带宽提升4倍，满足复杂模型对于数据高并发处理的需求；
内存容量提升3倍，为大规模参数模型提供强大支持。

更重要的是，Trn2实例的性价比提升显著，相比传统GPU实例（P5e和P5en）高出30-40%，大幅降低了算力成本。

对于超大规模计算需求，亚马逊云科技还推出了Trn2 UltraServer。

每台UltraServer集成了64颗Trainium2芯片，并通过NeuronLink高速互联实现2TB/s带宽和1微秒级延迟。

这款产品为超大规模AI模型训练提供了理想的算力平台。

除此之外，在芯片层面上，亚马逊云科技宣布将在2025年推出Trainium3芯片。

据悉，Trainium3将采用3纳米工艺制造，提供两倍于Trainium2的计算能力，并提升40%的能效。

在存储（Storage）层面，亚马逊云科技发布了专为表格数据设计的Amazon S3 Tables，性能和效率再次升级。

Amazon S3 Tables引入了一种创新的存储解决方案，专门针对表格数据优化，并兼容Amazon Athena、Amazon EMR以及Apache Spark等主流查询工具，以便用户能够便捷地执行数据查询操作。

作为S3的第三种存储类别，表存储桶与通用存储桶和目录存储桶相辅相成，它被设计为一个分析型数据仓库，适合存放多种模式的Iceberg格式表格。

S3 Tables在性能上相较于传统的自管理表格存储有显著提升，查询速度可提高至3倍，事务处理速率可达10倍，且享有全面托管的服务带来的操作便利。

在数据管理中，元数据的作用日益凸显，例如，手机中存储的大量照片能够通过元数据快速定位，使用自然语言即可迅速检索到特定照片。

为满足此类需求，亚马逊云科技推出了Amazon S3 Metadata的测试版，旨在提供更加智能和高效的元数据管理功能。

Amazon S3 Metadata 提供了一种智能化、便捷的元数据管理方案，实现了近乎实时的元数据更新，帮助用户高效地组织、识别和利用S3数据，支持业务分析和实时推理等应用场景。

该功能支持对象元数据管理，既涵盖系统生成的详细信息（如文件大小和来源），也允许用户自定义元数据。用户可以通过标签为对象附加额外信息，如产品SKU、交易ID或内容评级，进一步提升数据的分类与检索效率。

此外，这些元数据信息被无缝整合到 S3 Tables 中，进一步强化了数据的管理与分析能力。

最后一层，便是数据库（Database）了。

亚马逊云科技发布了新型无服务器分布式数据库Amazon Aurora DSQL，旨在解决传统数据库在扩展性和性能方面的挑战，目前可以实现：

跨区域强一致性和低延迟；
无限扩展，可轻松处理TB至PB级数据；
超高可用性，达到99.999%的可靠性。

与此同时，Amazon DynamoDB global tables也增加了多区域强一致性支持，进一步增强了其分布式数据库服务能力。

数据分析能力也是Up Up Up

此次发布的最后一部分，便是分析板块。

亚马逊云科技所发力的点，便是其一站式数据、分析与AI解决方案中心——新一代Amazon SageMaker。

新一代SageMaker的核心是SageMaker Unified Studio。

这是一个单一的数据和AI开发环境，它整合了Amazon Athena、Amazon EMR、AWS Glue、Amazon Redshift、Amazon Managed Workflows for Apache Airflow (MWAA)以及现有的SageMaker Studio中的工具和功能。

其次是Amazon SageMaker Lakehouse，可以统一Amazon S3数据湖、Amazon Redshift数据仓库和第三方及联合数据源。

除此之外，还包括Amazon SageMaker HyperPod的新训练配方功能、灵活训练计划和任务治理功能，以及在Amazon SageMaker中使用亚马逊云科技合作伙伴的热门AI应用。

这些功能将帮助客户更快开始训练流行模型，通过灵活训练计划节省数周时间，并将成本降低高达40%。

以上就是今年亚马逊云科技给予大模型时代客户们的种种新的选择了。

而这种“以客户为中心，逆向工作（work backward）”为基因的云计算巨头，还将以“提供选择权”的方式在这个时代给我们带来怎样的惊喜，是值得期待一波。

— 完 —

点这里👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

量子位

追踪人工智能新趋势，关注科技行业新突破

最新文章

Ilya宣判后GPT-5被曝屡训屡败，一次训数月，数据要人工从头构建

素数分布规律又有新发现！赵宇飞学生与牛津教授合作成果

o3来了！编程跻身人类全球前200，破解陶哲轩说难的数学测试，北大校友任泓宇现身直播间

图森未来转型6个月：推出AI大模型，布局游戏生态，思考和底气是什么？

这届AI创业：不敲一行代码，营收突破百万级

AI已经在直播间狂刷KPI了

AI风暴席卷达摩院青橙奖，六成获奖者用AI搞科研，平均年龄34岁

1万人研究证实：玩游戏提升智力，与遗传/经济水平都无关

AI能传递气味了！能定制个性化气味，谷歌前研究员新技术

突发！GPT论文一作Alec Radford离职，前两代GPT作者全部离开OpenAI

不会代码的独立开发者，除了学Cursor，还该会些什么？｜十问爆款「小猫补光灯」

谷歌版o1突发即屠榜！思考速度比所有模型快5倍，能解摩斯代码，数学物理秒秒钟解决

苹果Mac用户狂喜！ChatGPT深度集成应用，最后再藏AGI彩蛋

豆包升级了“眼睛”，看APP截图就能写代码了！超低价让多模态AI普惠

100+大模型综测结果出炉！智源发布FlagEval“百模”评测结果，覆盖文本语音图片视频多种模态

12个大模型攒局玩“大富翁”：Claude3.5爱合作，GPT-4o最“自私”｜谷歌DeepMind研究

Claude团队揭发AI伪装对齐：训练时假装遵守目标，只为保护自己价值观不被修改

腾讯版Sora开源后，被提速8倍！官方点赞并预告：下月上新图生视频

突破自动驾驶视频生成极限：港中文&港科大&华为联手推出MagicDriveDiT

刚刚，AI颠覆物理模拟：一句话精准仿真，学术圈半壁江山联手耗时24个月研究成果

云计算一哥的生成式AI之道：Choice Matters

大模型是新的数据库！蚂蚁开源负责人王旭：应用开发新范式，新一代LAMP正在形成 | MEET 2025

英伟达新品“掌心AI超算”，¥1800跑8B多模态模型，算力暴增70%价格腰斩

GPT-4o数学能力跑分直掉50%，上海AI Lab开始给大模型重新出题了

更懂中文还兼顾SD生态，360开源文生图模型结构，寡姐秒变中国新娘 | AAAI

我们要做3D界的ImageNet，推动具身智能训练新范式｜群核科技唐睿@MEET2025

见证历史！AI想的科研idea，真被人类写成论文发表了

从骁龙8至尊版，我看到了AI手机的未来 | 智在终端

新奥程路：AI×能源已到“奇点变革”前夜，仿真大模型是关键｜MEET 2025

开源Llama版o1来了，3B小模型反超80B，逆向工程复现OpenAI新Scaling Law

宇树机器人强化学习代码全面开源，还有训练到仿真和实操手把手教学

为多模态LLM引入ControlNet理念，开源插件解决灾难性遗忘 | AAAI

刚刚，智谱又融了30亿！超200亿估值引领大模型创业赛道

谷歌版Sora升级4K高清！一句话控制镜头运动，跑分叫板可灵海螺

ChatGPT搜索与Her打通了！搜索免费开放，居然还剧透明日直播主题

Kimi版o1实装上线，这里是我们的一手测试↑

把1个脑洞发展成1场顶会workshop，阿里妈妈只用了1年｜直击NeurIPS'24

企业级Agent已进入生产力阶段｜BetterYeah AI张毅@MEET

Gemini 2.0成P图神器，各种P图只需一句话的事儿，可把网友馋哭了

21天不用手机，抑郁减少，入睡更快丨正经研究

基于昇腾算力突破AI求解，最高加速100倍！| 华为GTS&深圳市大数据研究院

全球首个全模态理解开源端模型：长语音自动总结，图文音啥都会！300%推理速度领先，来自无问芯穹

月薪1万4的ChatGPT要来了！OpenAI自曝其达博士级别，网友：我宁可聘请一个博士

直击CCAI大会：院士专家舌战激辩，20个AI案例C位出道，海淀无愧AI科技“梦工厂”

OpenAI附议Ilya预训练终结！“但Scaling Law还没死”

Scaling Law不总是适用！尤其在文本分类任务中，vivo AI Lab提出数据质量提升解决方法

Ilya宣判：预训练即将终结！NeurIPS现场沸腾

ChatGPT终于也推出Projects功能，却故意露出一个“AGI”的项目

4000万+用户！测测CEO任永亮：一个行业既不能离AI太近也不能离AI太远 | MEET 2025

专治大模型“套壳”！上海AI实验室等给LLM做“指纹识别”，剪枝合并也无所遁形

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

云计算一哥的生成式AI之道：Choice Matters

允中 发自 凹非寺量子位 | 公众号 QbitAI

亚马逊的“AI步法”：Choice Matters

提供了怎样的AI选择权？

△亚马逊云科技大中华区产品总经理，陈晓建

新款自研基础模型

云计算，也全面升级

数据分析能力也是Up Up Up

允中发自凹非寺
量子位 | 公众号 QbitAI