英伟达:新的生成式 AI 路线图

科技   科技   2024-09-13 07:50   福建  
芝能智芯出品

英伟达发布了新一轮的生成式人工智能蓝图,加速企业开发和部署生成式 AI 应用程序的进程。

这些蓝图是其更大范围内企业 AI 战略的一部分,结合了硬件创新和软件优化,为各类开发者和组织提供了一个灵活且高效的开发环境。


Part 1

英伟达推理微服务与 NIM 战略


英伟达推理微服务(NIM)是英伟达为企业创建 AI 应用的核心工具之一。NIM 提供了一个包含一系列预构建微服务的容器化环境,可以在云端或数据中心内部署。

NIM 的核心组件包括开源大语言模型、云原生堆栈、英伟达的 TensorRT 和 TensorRT-LLM、Triton 推理服务器以及标准 API。

这一切都基于 Kubernetes 构建,为开发者提供了一个强大且灵活的开发平台。

英伟达企业 AI 软件产品副总裁贾斯汀·博伊塔诺(Justin Boitano)强调,NIM 是他所称的“第二波生成式 AI”的一部分,这一波将发生在企业层面,使企业能够更好地利用内部知识库来推动业务运营、客户互动和创新。

这与此前由 OpenAI 的 ChatGPT 等工具引发的第一波浪潮有所不同,后者主要提升了个人的生产力。


英伟达推出了 NIM Agent 蓝图,这是专门为开发定制生成式 AI 应用程序的开发者设计的参考 AI 工作流。

每个蓝图包括基于 NIM 和合作伙伴微服务的示例应用程序、参考代码、文档和 Helm 图表,旨在简化 Kubernetes 集群资源的部署过程。开发者可以根据具体需求对这些蓝图进行修改和定制。

NIM Agent 蓝图是英伟达描述的“数据飞轮”理念的一部分。当 AI 应用程序运行并与用户互动时,它们会产生大量数据,这些数据会被反馈到流程中,从而在持续的学习周期中改进模型。

英伟达推出了 NeMo 框架,用于数据管理、模型定制和评估,帮助企业开发高效、灵活的生成式 AI 应用程序。



Part 2

初始的三种蓝图应用场景


● 英伟达最初推出了三种针对不同场景的蓝图:

◎ 数字人用于客户体验:这些数字人能够通过多渠道与用户交流,并结合检索增强生成(RAG)系统提供更个性化的互动体验。

◎ 企业 RAG 的多模式 PDF 数据提取:此蓝图帮助企业从大量的 PDF 文档中提取文本、图像、图表和表格等多种类型的数据,并有效转化为可以通过聊天界面或数字人访问的知识。

◎ 加速药物发现:利用生成式 AI 模拟可以靶向并结合蛋白质的分子,加快新药的研发过程。

英伟达还与多个合作伙伴合作,以完善和支持 NIM Agent 蓝图的开发与部署。例如,Dataiku 和 DataRobot 提供微调模型和监控工具;LlamaIndex 和 Langchain 用于构建工作流;Weights and Biases 用于评估应用程序;CrowdStrike、Datadog、Fiddler AI、New Relic 和 Trend Micro 提供网络安全解决方案。

此外,NIM Agent 蓝图还将在思科、戴尔科技、惠普企业、联想以及超大规模云提供商(如 AWS、谷歌云、Azure 和 Oracle 云基础设施)的系统上运行。



小结

英伟达的生成式 AI 蓝图和 NIM 战略,通过硬件和软件的协同优化,帮助企业更高效地开发和部署定制化的 AI 应用程序。

通过广泛的合作伙伴生态系统和创新技术解决方案,英伟达正在推动企业进入生成式 AI 的新纪元,助力各行业的数字化转型。

通过软件工具和平台推动生成式 AI 在企业中的应用,加速从研发到生产部署的过程。 

芝能智芯
在这个数字时代,芯片及其基于的软件已经成为现代社会不可或缺的一部分。深入跟踪和分析这些技术的发展趋势变得愈发重要。而位于中国的上海,被誉为中国的芯片硅谷,将有着更多的机会为我们提供深入了解半导体行业以及中国芯片产业链发展的平台。
 最新文章