甲骨文吴承杨:生成式 AI 难以落地,缺少以 AI 为中心的应用开发架构是关键

科技   2024-11-08 14:08   辽宁  

作者 | 褚杏娟

“云、人工智能和数据,把它们有机地结合起来,这就是 Oracle 要做的事情。”甲骨文公司副总裁及中国区董事总经理吴承杨说道。

在今年的全球云大会上,Oracle 旗帜鲜明地表明了自己的重点方向,无疑也是当下最热门的几个技术领域。与此同时,Oracle 也有了落地案例,比如法国巴黎银行正在 Oracle Exadata 私有云上使用人工智能 (AI) 模型,发展业务的同时也加强了网络安全等。

多云,不完全是技术问题

“现今,并不是所有的云供应商都愿意在沟通当中首先谈多云。”吴承杨表示,多云是用户的根本需求,就像用户愿意选择多个数据库。而对于多云的态度,更多是云供应商的意愿问题,而不完全是技术问题。

Oracle 在多云上已经做出了自己的选择。Oracle 多云战略现在有两种表现形式:

  • Oracle 数据库服务可以在 Google Cloud、AWS 和微软 Azure 中提供。很多企业的核心应用选择 Oracle,但基础设施选择 AWS、GCP 等,以前需要网络打通或要拉专线,而直接把 Oracle 数据库的基础设施放在客户的 GCP 等数据中心就可以很好地解决网络延迟等问题。另外,很多企业要开始尝试 AI,其中绕不过去的是私有数据处理问题,无论用 AWS 的 AI 还是 GCP 的 AI,都需要获得 Oracle 数据库里的数据。

  • Oracle Database@Azure 现已在 6 个 Azure 数据中心推出,还很快将在另外 15 个地区推出。Oracle Database@Google Cloud 已在美国和欧洲的 4 个 Google Cloud 区域中全面推出。现在,用户可以在特定的 Google Cloud 数据中心内基于 OCI 运行 Oracle Exadata Database Service、Oracle Autonomous Database 和 Oracle Database Zero Data Loss Autonomous Recovery Service。

“两个数据中心的连接,像我们和谷歌 GCP 的端口之间,它是免费提供的。这意味着,对于某一个应用,如果 Oracle 有价格优势,用户可以转到 OCI 来,也可以用在 GCP 上。”吴承杨介绍。

“建立大型数据中心和算力的原因,根本来讲是因为需求太大了。”吴承杨表示,客户想去做各种各样的 GPU 应用,从通用领域到专业领域,都需要大量的 GPU。建立数据中心首先需要 GPU 集群,其次需要网络把多台机器连接起来,然后需要存储,更重要的是发热处理与电力来源。

目前,业内对数据中心的定位和理念,基本上是两种思路:一是业界更为普遍的作答,在全球建立数量有限、但规模很大的数据中心;二是提供多种多样的数据中心,既有超大型规模的,也有中型的和小型的。Oracle 的选择是后者,让数据中心整个的体量根据客户的情况有所变化。

目前,Oracle 在全球已经建成和正在建的共有 162 个 OCI 区域,其中就包含可能只是为某一个客户建立的公有云。

甲骨文公司中国区技术咨询部高级总监嵇小峰介绍,Oracle 和其他云厂商的区别在于 OCI Dedicated Region,“我们从最早的二十多个 rack(服务器机架)到十多个 rack,再到目前的 3 个 rack。跟以前不一样的是,以前的 rack 放在客户的数据中心需要一个连续的空间,但现在 3 个 rack 可以不挨在一起,带来了很多的便利性。”

“更重要的是,借助 Oracle Database@AWS、Oracle Database@Azure 和 Oracle Database@Google Cloud,客户可以直接访问在 OCI 上运行并直接部署在四大云厂商的数据中心内的 Oracle Database 服务,这就是我们的技术优势之一。”嵇小峰说道。

通用型大语言模型的本地化部署有两大挑战,第一是供电,第二是冷却,这对基础设施的要求非常高,一般的企业是无法负担的。不过在某些专业领域,比如癌症筛查,还是有可能本地化部署大模型的。

AI,围绕企业应用

对于 AI,李珈表示 Oracle 的定位非常清楚:关注数据和 AI 生成式应用本身,而不是大语言模型。”总体看,Oracle 的策略是围绕着企业使用 AI 的实际场景而制定,其中主要有三种不同的模式:基础设施、模型和服务以及应用内服务。

“当下生成式 AI 的热度很高,但是缺少了以 AI 为中心的企业级开发架构,因此无法真正落地,为企业提供价值,这是问题的根本。”吴承杨说道。

吴承杨提到,生成式 AI 有几个根本性的问题:一是幻觉问题,二是非实时性的,三是没办法给到企业内部的数据。幻觉是企业普遍担心的问题,要解决这个问题需要 RAG 技术,它支持企业把自己的实时数据灌进去,来达到大量的减少幻觉的目的。但这也不能完全杜绝幻觉的出现。

“Oracle 能做到更进一步,即与自己内部的核心关系数据进行交叉对比,以此减少大模型幻觉。总的来说,Oracle 可以让客户在同一个平台上,既能够做向量数据库,又能够做关系型数据库,还能够做 RAG,这是 Oracle 的独家优势。”

而以 AI 为中心的基础设施需要具备三个能力:第一,模块可以组装、互相独立,可以各自发展;第二,整个应用要能够用声明式的语言简单地翻译,对它进行描述;第三,健壮性、高可用性、安全性、一致性这些都是底座,不需要开发人员关注这些问题。

李珈介绍,Oracle 的 AI 战略覆盖整个公司和产品组合。“要把生成式 AI 变成企业级应用,Oracle 有很多相关服务,比如在 OCI 上有许多可使用的 AI 服务,我们还有一些行业解决方案,比如说在 ERP 中就有几十个可嵌入的 AI Agent,我们还有 AI 平台,让客户在整个技术堆栈中,可以在本地搭建 AI。”

Oracle 因此推出了一个新的理念,生成式开发基础设施 GenDev,在 OracleDatabase23ai 中引入了以人工智能为中心的生成式开发基础架构,开发人员可专注于构建应用功能,而非数据基础设施需求。另外,Oracle 推出了生成式 AI RAG Agent 和增强型 AI 服务,来帮助企业解决业务问题,发布了 Oracle Code Assist 测试版帮助提高开发人员的速度、OCI Kubernetes Engine 增强功能可帮助企业大规模训练和部署 AI 模型等。

“Oracle 提到的以 AI 为中心的开发架构,并不是一个关于未来的时间表,已经成为现实。比如对于应用开发商 ISV 来讲,采用 AI 为中心开发的架构可以实现更高效的开发。”吴承杨强调。

点击底部阅读原文访问 InfoQ 官网,获取更多精彩内容!

今日好文推荐

全球超万亿使用量的热门数据库,首次被大模型揪出了严重漏洞

数据碎片化、基础设施落后,看金奖团队如何为农业生产转型提供新解法

美国大选倒计时:软件崩溃、密码泄漏,投票系统研发人员比候选人更“焦虑”?

“前端”架构真的有必要存在吗?

 会议推荐

就在 12 月 13 日 -14 日,AICon 将汇聚 70+ 位 AI 及技术领域的专家,深入探讨大模型与推理、AI Agent、多模态、具身智能等前沿话题。此外,还有丰富的圆桌论坛、以及展区活动,满足你对大模型实践的好奇与想象。现在正值 8 折倒计时,名额有限,快扫码咨询了解详情,别错过这次绝佳的学习与交流机会!

InfoQ
为一线互联网公司核心技术人员提供优质内容。科技圈的观察者,前沿技术的传播者。
 最新文章