亚马逊的新一代基础模型提供前沿智能和行业领先的性价比。
美通社消息,亚马逊在2024 re:Invent全球大会上,宣布推出新一代基础模型Amazon Nova,这些模型在多种任务上展现出优秀智能,且具备行业领先的性价比。Amazon Nova模型将在Amazon Bedrock中提供,包括超快速文本生成模型Amazon Nova Micro,以及能够处理文本、图像和视频并生成文本的多模态模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier。此外,亚马逊还推出了两个全新模型——用于生成高质量图像的Amazon Nova Canvas和用于生成高质量视频的Amazon Nova Reel。
Amazon Nova理解模型展现出卓越的智能、能力与速度
Amazon Nova包含四款先进的模型。Amazon Nova Micro是一款仅处理文本的模型,能够以极低的延迟和成本提供响应。Amazon Nova Lite是一款极具成本效益的多模态模型,能够快速处理图像、视频和文本输入;Amazon Nova Pro是一款功能强大的多模态模型,可在准确性、速度和成本之间实现绝佳平衡,适合多种任务;Amazon Nova Premier是亚马逊的顶级多模态模型,专为复杂推理任务而生,并可用于作为“教师模型”来蒸馏定制模型。目前,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用,Amazon Nova Premier预计将在2025年第一季度可用。
亚马逊对Amazon Nova模型进行了广泛的行业基准测试。结果表明,Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro在各自类别中与最佳模型相比均表现得相当有竞争力。
Amazon Nova Micro、Lite和Pro支持200多种语言。Amazon Nova Micro支持128K输入token的上下文长度,而Amazon Nova Lite和Pro的上下文长度可达300K token,处理视频时长可达30分钟。到2025年初,Amazon将支持超过200万输入token的上下文长度。
借助Nova创意内容生成模型,访问生产级视觉内容
Amazon Nova Canvas是一款先进的图像生成模型,能够根据输入的文本或图像生成专业级的视觉内容。它提供了便捷的编辑功能,用户可以通过文本轻松调整图像,控制颜色方案和布局。该模型内置的安全控制措施确保AI的安全和负责任使用,包括水印功能,能够追溯每张图像的来源;以及内容审核功能,限制可能产生的有害内容。根据第三方的对比评估,Amazon Nova Canvas在性能上优于OpenAI的DALL-E 3和Stable Diffusion,并在关键的自动化指标上表现出色。
Amazon Nova Reel是一款先进的视频生成模型,能够帮助客户轻松从文本和图像创建高质量视频,适用于广告、营销和培训等内容创作。客户可以使用自然语言提示控制视觉风格和节奏,包括相机运动、旋转和缩放。根据第三方的评估,Amazon Nova Reel在质量和一致性上优于同类模型,客户更倾向于选择由其生成的视频,而非Runway的Gen-3 Alpha生成的视频。与Amazon Nova Canvas一样,Amazon Nova Reel也具备内置的安全控制措施,包括水印和内容审核。目前,Amazon Nova Reel支持生成六秒的视频,未来几个月将支持最长为两分钟的视频生成。
下一步计划:语音到语音和多模态到多模态模型
亚马逊计划在2025年第一季度推出Amazon Nova语音到语音模型。该模型旨在通过理解自然语言的流式语音输入,解释语言和非语言信号(如语调和节奏),提供流畅的类人交互,彻底改变对话式AI应用,确保低延迟的双向交流。
此外,Amazon还在开发一种新模型,能够接受文本、图像、音频和视频作为输入,并以任意模态生成输出。这款具备本地多模态到多模态——即“任意到任意”模态能力的Amazon Nova模型预计将在2025年中旬推出。该模型将简化应用开发,使同一模型能够执行多种任务,如内容模态转换、内容编辑,以及驱动能够理解和生成所有模态的AI代理。
联系美通社
+86-10-5953 9500
info@prnasia.com