Digital Visionaries Symposium 作为亚洲企业人工智能和数字金融领域的标杆活动,它汇聚了全球金融服务的核心业务负责人、技术领袖和政策制定者,共同探讨企业人工智能和数字金融中最为紧迫的问题。今年在香港举办的 DVS 2024 为期 2 天的活动过程中,共有 60 位来自全球的演讲嘉宾,20 个议程,线上线下累计超过1000位参会人员,在众多议题中,AI 相关的内容占比过半,「DaoCloud 道客」非常荣幸携 d.run 智能中台解决方案亮相,同时,首席运营官张红兵的演讲为众多参会嘉宾带来了面向金融行业的 AI 中台搭建的思路和落地实用场景。
01
AI 中台
—数智化转型推手
在 AI 数智化的时代浪潮中,金融行业因其数字化程度高和技术密集的特性,始终站在技术应用的前沿。随着人工智能技术的不断渗透,金融行业在企业内部知识库、智能机器人、投资算法、客户运营、安全合规等多个业务场景中实现了应用创新。然而,AI 技术的融入也对金融机构的传统 IT 基础设施提出了新的挑战。
过去,通用算力中心为金融机构提供了广泛的 IT 服务。但随着 AI 业务的深入融合,金融机构需要更高效的基础设施支持,诸如高性能的计算硬件、算力资源的高效使用、适配 AI 应用的算力调度和分配,支持低延时高吞吐的业务需求、以及保障系统稳定性等都是业内十分关注的问题。对此,我们的目标是升级通算中心为智算中心,构建一个能够纳管、调度高性能基础设施的金融级 AI 中台,不仅能够提升金融服务的效率,还能增强用户体验,并创造新的价值。
在金融行业 AI 数智化转型的道路上, AI 中台扮演着至关重要的角色。它作为前台业务与后台基础设施之间的桥梁,需要在 AI 技术蓬勃发展的背景下,有效地管理和调度异构算力资源,以提升资源使用效率。同时,智能中台还需确保数据安全和合规性,保障金融服务的高可用性和敏捷性。
02
多维度效率提升
企业在实际运营中发现,GPU 资源的有效算力与拥有量之间存在巨大差距。在缺乏软件优化的情况下,30% 的使用率已属不易,这无疑造成了资源的极大浪费。例如,在大模型知识库语料准备或简单推理任务中,GPU 显存并未得到充分利用。传统的整卡模式调度方式无法发挥算力的全部效率。「DaoCloud道客」提供的 d.run 智能中台通过 GPU 虚拟化技术,可以将显存拆分到 1% 的颗粒度,为 GPU 使用效率的提升创造了条件,分配之后剩余的闲置资源可以通过智能中台的调度策略支持其他的工作任务,从而最大化使用算力资源。
同时,金融业务对网络的低延迟和高吞吐量有着极高的要求,尤其是在高频交易场景中,微秒级别的延迟提升都可能影响交易结果。「DaoCloud 道客」的 d.run 智能中台通过网络亲和性调度,将交易 Pod 调度至物理位置接近交易所的节点,减少网络延迟,提高交易速度和业务效率。
此外,金融业务对系统稳定性的要求极高,除了容灾备份等保障措施之外,快速准确定位故障是提升运维效率的关键。d.run 智能中台的可观测性能力使得运维团队能够迅速定位故障点,便于及时修复,保障业务连续性和稳定性。通过这些技术的应用,金融机构能够提升资源效率,增强业务敏捷性,确保系统的高可用性和稳定性。
热门推荐
访问以下网址,或点击文末【阅读原文】立即体验
DaoCloud 公司简介
网址:www.daocloud.io
邮件:info@daocloud.io
电话:400 002 6898