构建生成式 AI OpenUSD 应用，呈现准确的品牌营销视觉

科技 2024-12-18 18:12 北京

如今，品牌及其创意机构承受着巨大的压力，从活动关键视效到电商的包装图等，他们需要大规模地创建和提供高质量、准确的产品图片。以受众为目标的内容，如个性化和本地化的视觉变化，增加了制作的复杂性。

制作成本、紧迫的时间安排、资源和维护品牌形象都是营销团队为其受众创建更多资产和更具针对性的内容的重复阻碍。

例如，意式特浓咖啡制造商即将推出的产品可能想要针对面向广泛的受众，从居住在城市的年轻专业人士到在乡村享受退休生活的老一代。过去，这需要多个工作流、多个地点、多个团队和多个审查周期来执行，而这往往很难达到，从而限制了营销团队可用于定位的可用内容。

为了大规模地生成高质量、符合品牌定位的内容，创意团队现在可以利用生成式 AI 工作流。将生成式 AI 集成到用于生成准确的视觉资产和制作内容的工具与应用中，可以为内容供应链带来新的可能性和效率。

许多开发者已经在努力将其变为现实。

在本文中，我们将介绍用于精确视觉生成式 AI 的 3D 调节（3D Conditioning for Precise Visual Generative AI ）的 NVIDIA Omniverse Blueprint，概述其工作原理及其用途，并了解行业领先者如何考虑该领域的发展。

NVIDIA Omniverse Blueprint 是参考工作流，可让用户轻松实施和构建 3D、仿真和数字孪生应用。

图 1. 使用 NVIDIA Omniverse 3D Conditioning for Precise Visual Generative AI 创建的输出图像示例

模型调节以解锁生成式 AI，实现可扩展和可控的资产创建

如果无法控制产品的视觉输入，将生成式 AI 集成到工作流中创建精确品牌形象时可能会出现问题。如果没有特定的调节，特定的几何体、颜色、徽标和品牌指南被误解或丢失。

模型调节是指为模型提供特定信息或规则，帮助其根据期望做出更好的预测或决策。要调节 LLM，需要提供基于文本的说明、示例、上下文或之前的对话历史记录。对于图像生成器，可以提供文本或示例图像。

但这只能为 AI 模型提供有限的控制。这就是为什么需要 3D 调节。

通过在 3D 环境中设置 Stage，艺术家能够对生成的视觉效果的输出进行出色的创意控制或指导。为终端用户交互构建易于使用的 UI，使非技术团队能够在受控和经过调节的框架中迭代和创建内容，同时保持品牌资产不受 AI 影响。

该 Omniverse Blueprint 采用多模态方法，结合了使用 3D 的核心资产和简单的环境几何体，以及 2D 渲染通道，可快速修复以完成受控场景。用户可以通过蒙版来保持产品数字孪生的完整性，还可以通过更改摄像头角度和缩放 3D 视窗来构图镜头。

为精确视觉生成式 AI 构建经 3D 调节的工作流涉及以下几个关键组件：

品牌核心资产：由艺术家创建并通常由品牌经理和艺术总监批准的最终资产，被视为核心资产。以上面的例子来说，提供一个简单的咖啡机模型。
简单、无纹理的 3D 场景： 由 3D 艺术家提供，用于放置核心资产并控制布局和构图。
自定义应用程序： 使用基于 Kit 106.2 的 Kit App 模板构建。
生成式 AI 微服务和 Kit 扩展程序：为自定义应用添加生成式 AI 功能。在这种情况下，扩散模型（例如 Stable Diffusion）负责修补。
解决方案测试：验证集成工作流的功能和性能。

对于此工作流，我们专门研究了能够让用户在使用生成 AI 的同时，也充分利用 OpenUSD 进行 3D 应用和工作流开发的微服务。

Omniverse Blueprint 旨在实现可扩展和可定制。以下是可以在工作流中引入的一些其他组件：

大型多模态模型（LMM）+ ComfyUI：快速生成式文本转图像模型，可根据文本提示合成逼真图像。
Edify 360 NIM：Shutterstock 提供早期访问预览版，用于生成 360 度高动态范围图像（HDRI）。该模型使用 Shutterstock 的许可创意库在 NVIDIA Edify 上进行训练。
Edify 3D NIM：Shutterstock 提供的 3D 资产生成服务，用于场景布置中额外的 3D 对象生成。使用 NVIDIA Edify 和 Shutterstock 许可的创意库进行训练。
USD Code：一个语言模型，能够回答OpenUSD知识查询并生成USD Python代码。
USD Search：一个AI驱动的搜索工具，使用文本或图像输入来搜索 OpenUSD 数据、3D 模型、图像和资产。

在本工作流指南结束后，用户将能够使用 AI 开发自己的自定义应用，以支持并加速创意和营销团队。所有微服务目前均可在 build.nvidia.com 上预览，用户可以在其中调用 API 进行评估。

图 2. NVIDIA Omniverse Blueprint 用于精确视觉生成式 AI 的 3D 调节的架构

利用 NVIDIA Omniverse Blueprint 构建营销生态系统

独立软件供应商（ISV）和生产服务机构的开发者正在正在构建下一代内容创作解决方案，这些解决方案融合了可控的生成式 AI，并基于 OpenUSD 构建。

例如 Accenture Song 、 GRIP 、 Monks 、 WPP 和 Collective World 正在采用 Omniverse Blueprint 来加速开发。

开发可扩展的 AI 解决方案，以创建符合品牌的资产

此蓝图提供了如何构建可控的生成式 AI 应用的架构示例。用户现在可以充分利用其应用：

多模态 AI 生成的最终帧活动资产
为关键视觉快速构思概念与创意
批量处理提示输入，从数据库中预定义的文本提示生成可能的数百种视觉输出

实施该蓝图能够获得以下优势：

加快上市时间：可显著缩短创建高分辨率品牌资产所需的时间，从而加快产品上市速度。
轻松实现本地化：支持即时创建本地化图像，以帮助品牌满足不同市场的文化趋势或要求。
提高生产力：使用 3D 数据的易用工具可以降低传统上与高保真资产创建相关的技术技能要求。

开始使用

本文介绍了用于精确视觉生成式 AI 的 3D 调节的 NVIDIA Omniverse Blueprint，并展示了如何通过构建生成式 AI 应用程序来生成符合品牌的视觉资产和内容制作。

有关更多信息，请参阅以下资源：

通过 NVIDIA API Catalog 中的交互式演示进行 3D 调节，实现精确的视觉生成式 AI 蓝图：https://build.nvidia.com/nvidia/conditioning-for-precise-visual-generative-ai
USD Search API 的 GA 版本：包括可下载的 Helm 图表，用于自行部署以便在自己的基础设施上与自己的数据进行交互：https://build.nvidia.com/nvidia/usdsearch
参考架构示例工作流，以及实施蓝图的指南：https://resources.nvidia.com/en-us-omniverse-product-configurator/blueprint-3d-conditioning
/NVIDIA-NIM-Agent-Blueprints/ GitHub 库，包括工作流程指南（用于 3D 调整）：https://github.com/tree/main

点击“阅读原文”或扫描海报二维码，北京时间 1 月 7 日（星期二）上午 10:30 观看 NVIDIA CEO 黄仁勋在拉斯维加斯现场发表的 CES 开幕主题演讲。

NVIDIA英伟达企业解决方案

NVIDIA，一家全栈计算公司，其一直是加速计算领域的先驱，GPU 驱动了PC游戏市场增长，重新定义现代计算机图形，开启现代AI时代，正在推动工业元宇宙的创造。

什么是机器人仿真？

降低噪声：CUDA-Q 助力业内首个量子计算逻辑量子比特演示

Omniverse 资讯速递 | 工业数字化精彩视频、应用案例等你来解锁！

“Super”赋能 NVIDIA Jetson Orin Nano 开发者套件实现性能飞跃

Zordi 使用 AI 和机器人技术在室内种植美味的草莓

NVIDIA Research 开发的模型实现了快速、高效的动态场景重建

Vay 引领出行新方式：借助 NVIDIA DRIVE AGX 平台加速先进自动驾驶汽车方案的部署

NVIDIA 推出高性价比的生成式 AI 超级计算机

构建生成式 AI OpenUSD 应用，呈现准确的品牌营销视觉

工业数字化精彩视频：利用 NVIDIA Omniverse 和 AI 共同塑造智能、高效、可持续的工业未来

洞见 AI 创新：IDC 生成式 AI 白皮书亮点速递

TensorRT-LLM: LLM API 精简指令畅享卓越性能！

在线研讨会 | NVIDIA AI 加速精讲堂 - FP8 在大型模型训练中的应用、挑战及实践

ROSCon China 2024 落幕，看 NVIDIA 如何赋能机器人技术创新与应用

NVIDIA 合作伙伴携前沿应用亮相 ROSCon China 2024

如何使用 FP8 加速大模型训练

NVIDIA 通过加速 AWS 上的机器人仿真推进物理 AI 的发展

亚马逊云科技上的 NVIDIA NIM 大幅增强 AI 推理能力

洞悉 Omniverse：生成式 AI 如何通过 OpenUSD 实现准确符合品牌形象的个性化视觉效果

将实时 IoT 数据连接到数字孪生，实现 3D 远程监控

NVIDIA 打造 Earth-2 以洞见未来

Omniverse 资讯速递 | SC24 最新发布、工业数字化视频、应用案例等你来解锁！

设计与仿真领域资讯速递：了解 NVIDIA 如何助力提效减排、媒体直播、CFD 仿真等领域！

NVIDIA 培训 | AI 培训班新课，学习提示工程构建 LLM 应用

通过 NVIDIA Project GR00T 推进人形机器人视觉和功能开发

NVIDIA TensorRT-LLM Roadmap 现已在 GitHub 上公开发布！

NVIDIA JetPack 6.1 通过优化摄像头堆栈和引入固件 TPM 大幅提升性能与安全性

NVIDIA 在亚马逊云科技 re:Invent 上使用加速计算推进 AI 发展

Katana Studio 使用在 NVIDIA Omniverse 上构建的实时应用简化汽车营销

在线研讨会：如何在 AI 领域加速职业发展（开发者专场）

NVIDIA DOCA 2.9 通过新的性能和安全功能来增强 AI 和云计算基础设施

借助 NVIDIA Isaac Sim，光轮智能加速具身智能研发落地

NVIDIA与微软在Microsoft Ignite上展示Blackwell预览、Omniverse工业AI和RTX AI PC

NVIDIA 自动驾驶实验室：用于自主系统的实时检测基础模型

汽车厂商展示未来：由 AI 赋能基于 NVIDIA DRIVE 的汽车在广州车展上大放异彩

SC24 | 从算法到原子：NVIDIA ALCHEMI NIM 助力电动汽车电池、太阳能电池板等领域加快开发可持续材料

在线研讨会：如何在 AI 领域加速职业发展（开发者专场）

SC24 | NVIDIA 推出 BioNeMo 开源框架，扩大全球生物制药和科学行业的数字生物学研究规模

SC24 | NVIDIA 助力谷歌量子 AI 通过量子器件物理学模拟加快处理器设计

科研机构借助 NVIDIA AI 平台确保医疗数据安全

日本创新企业借助 NVIDIA AI 和 Omniverse，将物理 AI 带入各行各业

Omniverse 资讯速递 | OpenUSD 研讨会预告、NVIDIA 解决方案、应用案例等你来解锁！

巅峰的训练性能：Blackwell 在 MLPerf 测试中将训练性能带到新高度

NVIDIA 解决方案：生成式 AI 在媒体与娱乐领域的应用

TensorRT-LLM 低精度推理优化：从速度和精度角度的 FP8 vs INT8 的全面解析

NVIDIA 解决方案：体育赛事直播

NVIDIA 在微软 Ignite 技术大会上助力企业开启 AI 和工业数字化之旅

日本科技领导者借助 NVIDIA AI Enterprise 和 Omniverse 推进主权 AI

研讨会预告：NVIDIA 携手 Ansys 共创工业元宇宙未来

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉