“大模型技术的创新与应用扩展了向量数据库的应用场景,也凸显了向量数据库部署的必要性。通过携手英特尔,我们为用户提供了软硬件协同优化的向量数据库方案,能够帮助用户有效应对海量向量数据处理带来的性能压力,为大模型时代构建高性能的数据库基础设施。”
— 关连坡
南大通用GBase 8a产品经营部总经理
“向量数据库和多模态数据处理等创新技术意味着,数据库领域正在发生更多的变革,带来更高的复杂性,以及对于多元算力的苛刻要求。英特尔正在利用创新的软硬件技术组合,推进基础设施的重构及优化,以构建新一代的数据库解决方案,帮助用户充分释放硬件潜力,加速数字化、智能化转型。”
——唐炯
英特尔(中国)软件技术合作事业部总经理
人工智能 (AI)、深度学习等技术的发展,催生了向量数据库的繁荣。通过向量数据库,用户能够像处理结构化数据一样地高效地处理海量的非结构化数据,赋能检索、推荐等应用。与此同时,向量数据库由于涉及到向量数据的索引、检索、生成,需要大量的矩阵计算,对于数据库的性能也带来考验。
在此背景下,GBASE南大通用推出了基于第五代英特尔®至强®可扩展处理器的向量数据库系统 (GBase 8a MPP Cluster,GCVD),该方案具备向量数据库的高维度支持、相似度搜索、支持多个向量字段、快速插入和更新、多模型联合分析、与大模型结合、易扩展、稳定可靠等特性,并能够利用内置的英特尔®高级矩阵扩展(英特尔® AMX)加速引擎,提升向量检索中矩阵计算的性能,实现了超过2倍的数据库整体性能提升。
向量数据库是一种专为管理向量数据而设计的数据库系统,其核心功能是理解和处理高维数据的相似性。通过向量数据库,用户能够更好地对图片、视频等非结构化数据进行分析,赋能检索、内容推荐等应用。而伴随着大模型等AI技术的崛起,企业对于向量数据库的需求显著提升,其作为典型AI系统的重要组成,得到了场景化落地。向量数据库的关键场景包括:
检索增强生成(RAG)
在向量数据库中进行相似性搜索,并获得返回的top-K个与用户问题最相似的结果。最后,合并返回结果与原始问题,以便大模型给出更准确的回答。
推荐系统
通过使用向量数据库进行向量相似性搜索,比较和计算用户向量和产品向量之间的距离,从而召回 Top-K个最相关的结果,为用户推荐匹配度更高的产品。
多模态检索
使用向量数据库可以实现多种不同模态的数据(如文本、视频、音频、图片等)进行联合相似性搜索。
此外,向量数据库的发展在推动AI等应用创新的同时,也为数据库基础设施带来了巨大挑战,这些挑战包括:
数据库性能出现瓶颈
由于向量数据规模的快速增长以及对实时性需求的日益凸显,企业对向量数据库的处理性能期望也越来越高,但其性能往往受到CPU性能、数据库架构等方面的严重制约。
数据库总体拥有成本 (TCO) 压力
为了应对日益增长的数据压力,企业往往需要在向量数据库基础设施建设、运维和实施等领域进行大量投资,带来了巨大的TCO压力。
基于第五代英特尔®至强®可扩展处理器的向量数据库GCVD
南大通用向量数据库系统GCVD在GBase 8a MPP Cluster架构基础上实现了向量数据库的功能,是继承了集群高可用、高可扩展性、高安全性以及运维管理能力的分布式向量数据库。GCVD通过存储数据向量并使用向量的相似度度量,实现高效、准确的数据搜索和分析,适用于各类 AI 驱动的应用场景,包括图片检索、视频分析、自然语言处理、推荐系统、定向广告、个性化搜索、智能客服、欺诈预防、基因检测等。
GCVD 架构图
GCVD 采用存算分离架构,各层均可独立扩展。整个分布式集群系统能够同时支持业务智能、报表分析、决策支持等传统分析业务和图像处理、推荐系统、自然语言处理、机器学习等向量数据业务,并具备高纬度支持、相似度搜索、多向量字段支持、快速插入及更新、多模型联合分析、大模型调优、易拓展、性能稳定等特性。
采用第五代英特尔®至强®可扩展处理器提升数据库性能
第五代英特尔®至强®可扩展处理器
为化解性能瓶颈,GCVD采用了拥有更可靠的性能、更出色的能效的第五代英特尔®至强®可扩展处理器。在实现工作负载显著每瓦性能增益的同时,提供更高的算力和更快的内存,并完全兼容上一代适配的软硬件,大幅减少测试和验证工作。
此外,GCVD充分利用处理器内置的英特尔® AMX加速器加速矩阵计算,高效地处理各类 AI任务所需的大量矩阵乘法运算,提升其在训练和推理时的工作效能。
英特尔®AMX 架构及GCVD 优化前后的性能
GBASE南大通用与英特尔携手在三节点集群上,验证了GCVD在使用英特尔® AMX 优化前后的性能表现。测试数据显示,使用英特尔® AMX优化后,GCVD的检索性能提升高达2.44倍。
用户收益
GBASE南大通用基于第五代英特尔®至强®可扩展处理器的向量数据库GCVD能够为用户带来如下收益:
加速数据库运行,为推荐系统、大模型、多模态检索等应用赋能:有效地化解了高性能向量数据库的CPU性能瓶颈,结合软件优化措施,在性能上有优秀的表现,能够应对海量业务带来的压力。
降低 TCO,提升向量数据库系统的投资回报率:支持用户以更低的服务器规模实现目标性能,这有助于降低相应的服务器扩展、能耗、数据中心空间等成本,提升投资回报率。
未来展望
大模型等AI技术的应用将驱动着向量数据库的不断落地、壮大,也凸显了化解性能瓶颈的重要性。GBASE南大通用携手英特尔为用户提供了高性能的向量数据库方案,能够帮助用户在保护基础设施投资的同时,更好地利用向量数据库在处理高维数据方面的优势,拓展大模型等新型业务场景。面向未来,双方将进一步深化合作,探索更多软硬协同的联合解决方案,为企业用户的数字化转型提供支持。
查看更多GBase数据库技术文章与问答分享,请访问GBASE南大通用技术社区:https://www.gbase.cn/community
本期编辑 | Suse
内容审核 | 生态发展部