Milvus在数派数据大模型业务中的实践

文摘 2024-08-21 18:30 上海

01.

写在前面

云南数派数据科技有限公司是一家总部位于美丽春城昆明的大模型创新企业，在深圳和昆明双城并立，设立了两个研发中心。我们的旗舰产品——SUPIEDT大模型开发平台，作为一款全生命周期的异构算力大模型开发平台，集一站式企业级大模型开发及服务运行等综合能力于一身。目前，该平台已成功落地全国10家人工智能算力中心，构建起强大的算力网络，能够向客户提供总量超过1000P的算力供应以及数十套大模型的行业解决方案。帮助客户在大模型时代，用得上、用得起、用得好。

02.

业务背景

在市场上除了大企业外更多的是咱们的中小企业以及个人，众多的中小企业正面临一种普遍的焦虑情绪，其核心担忧在于：若未能及时搭乘大模型技术的快车，恐将面临被时代浪潮淘汰的风险。然而，对普通企业来说，大模型入门门槛高，不知如何跨越这道门槛，融入这一技术革新潮流。鉴于当前这一现状，我们做了一些事情，把这个门槛降低，让每一位个人或企业都能够以极低的门槛将大模型在本地业务进行私有化的落地。

目前，我们业务正蓬勃发展，在全国范围内展现出了较强的竞争力。简而言之，我们是一个小而美的研发团队，我们也期望能够助力众多像我们一样的中小企业在大模型的时代尽早完成转身。

尤为值得一提的是，我们的平台将秉持开放共享的精神，实施开源策略，为更广泛的开发者及企业用户提供便利。

03.

Milvus与数派数据大模型业务的架构

Milvus作为业务架构中的核心模块，贯穿整个应用技术栈，起到了关键作用。整个应用可以架构在不同的硬件设备之上，对不同的数据进行向量化，将向量化的结果存入到Milvus向量库，由向量库为大模型以及应用提供数据。

04.

Milvus与数派数据大模型使用场景的结合

4.1基于Milvus知识库问答应用

随着企业业务与算力中心的日益普及，客户对我们的业务提出了新的期望：希望获得能够即刻投入使用且支持模型训练的开箱即用应用。这意味着用户能够先从应用层面直接体验，若需求未得到充分满足，再进一步进行模型调优。

在这一背景下，知识库成为了满足客户需求的关键工具之一。基于客户的迫切需求，因此集成了RAG能力，确保了知识库功能的即时可用性，这个场景就需要向量数据库的支持，特别是Milvus，它在后续的数据管理和模型评估中将发挥潜在的重要作用，确保数据的高效处理和模型的精准评估。

4.2基于Milvus的AI搜索应用

客户除了知识库问答之外，也对我们提出了需要具备AI搜索的能力，既能够检索联网信息，可以基于联网能力在极短的时间内构建行业基础知识库。同时也需要能够搜索本地数据，并且完成复杂的搜索任务。进一步的分析图表的呈现以及分析报告出具。该功能同样依赖于向量库的强大支持，Milvus作为向量数据库，确保信息检索的全面性与精准性。向量库作为核心组件，其应用深度与广度贯穿了我们产品的整个生命周期。

4.3基于Milvus的AI长文档编写应用

在提升查询效率的基础上，我们进一步开发了长文档写作功能，赋能用户撰写超长文档。这个过程中，用户可便捷地引用既存素材与资料，这得益于Milvus向量化存储和检索。

帮助用户快速找到相关文档或段落，提升写作效率和质量。

4.4基于Milvus的大模型一站式开发应用

除了开箱即用的功能之外，还可以在不满足预制模型的情况下进行数据标注、模型训练部署、AI应用构建等功能，通过我们精心设计的三步操作流程，能够高效实现企业私有化大模型的落地，而这一过程中，Milvus的应用更是不可或缺，它作为关键组件贯穿于数据工程、模型训练与部署等多个环节。

第一步，数据工程模块：

公开数据集采集：从互联网收集领域相关数据，通过处理与标注形成训练集。
自动数据标注：利用模型自动标注和合成数据，解决数据量少和标注难题。
数据处理Pipeline：内置工具去重、去隐私、统一编码等，辅助数据清洗。
数据质量校验：校验数据质量，提供评判依据。

‍‍

Milvus应用场景：

在数据质量校验过程中，涉及到对数据的存储、检索和对比，在标注以及检查的过程中，尤其是当数据量庞大且需要高效处理时，Milvus作为向量数据库，能够支持高效地向量相似度搜索，有助于快速识别和验证数据质量。

第二步，模型训练：

选择算力：通过平台选择适合的算力资源，无论是专属还是共享。
选择模型：从内置的上百款不同参数的大模型中选择所需模型进行训练。
选择数据集：选定先前准备的一个或多个数据集进行训练。
‍

Milvus应用场景：

在模型训练完成后，数据的管理和更新变得尤为重要。Milvus作为向量数据库，能够有效地存储和管理海量向量数据，包括数据集向量、训练日志、图表数据等。通过Milvus，用户可以高效地查询、检索和更新这些数据，为模型的持续迭代和优化提供有力支持。

在模型评估阶段，Milvus可以发挥重要作用。通过对模型输出结果的向量化处理，用户可以利用Milvus进行高效的相似性搜索和分析，从而评估模型的准确性和泛化能力。此外，Milvus还支持对时序数据的预测分析，帮助用户更全面地了解模型在不同场景下的表现，为后续的模型优化和部署提供重要参考。

第三步，部署及应用构建：

模型部署：用户可以直接部署或导出训练完成的模型，以便于快速测试和应用构建。
应用编排：将业务节点与大模型整合，打造定制化的大模型应用，无论是企业还是个人都能灵活构建。
‍

Milvus应用场景：

模型部署，需对模型进行持续优化或监控其性能时，Milvus可用于存储和分析模型的运行数据（如输入、输出、性能指标等），通过向量化技术，实现快速检索和对比不同版本的模型表现，为模型的优化提供数据支持。

在应用编排过程中，若涉及到需要处理或检索大量结构化、非结构化数据时，Milvus可作为底层数据库支持，提供高效的向量相似度搜索功能，加速业务处理流程。

05.

选择Milvus

在进行向量库选型的时候，我们基本上一开始就决定了选择Milvus作为我们的核心支撑，这一决策背后，是我们基于多维度指标的全面考量与深思熟虑。当时我们评估的主要指标就是：成熟度是否高、可扩展性是否强、是否拥有庞大的用户基数、是否拥有完整的生态、是否适配国产化、是否足够的方便易用。

多个算力中心稳定运行半年以上

我们首要关注的是其成熟度。Milvus作为成熟的向量数据库，经过多个版本的迭代与优化，其系统稳定性和兼容性得到了广泛验证。在关键业务场景中，Milvus能够确保数据的高可用性和低故障率，减少因系统不稳定导致的业务中断风险，我们在10个以上的算力中心稳定运行6个月以上，保障了众多用户的业务稳定运行。

维护成本降低30%

紧接着，我们审视了Milvus的可扩展性以及生态支持。Milvus支持水平扩展，能够轻松应对数据量的快速增长。随着业务规模的扩大，Milvus能够无缝扩展存储和计算能力，确保查询性能不受影响。相比传统数据库，Milvus在扩展性方面的优势以及庞大与生态系统的完整性也是我们不可忽视的重要因素，它们为我们提供了丰富的实践经验与强大的社区支持。这种强大的社区支持能够加速问题的解决，提高开发效率，作为整个应用的核心组件我们整个实施以及维护成本至少降低了30%。

多模态能力综合效率提升50%以上

最新版本的 Milvus 推出了 Hybrid Search 功能，大幅提升了多模态 RAG（Retrieval-Augmented Generation）流程的构建效率。单表默认支持多达 4 列向量，最多可支持 10 个向量列。在实际应用中，这一功能在我们应用场景中，综合效率提升达到了50%。同时，Milvus 原生支持多种融合策略，包括基于排名的 RRF（Ranked Retrieval Fusion）和基于得分（距离）的加权平均算法 WeightedRanker，这些策略在多模态检索与问答系统中实现了性能提升，查询准确率提高了，显著增强了系统的整体效率和效果。

综上所述，选择Milvus，是我们对技术前瞻性、实用性与可持续性的共同追求。

06.

总结

感谢 Milvus 向量数据库全体团队，其提供的稳定向量检索能力、多样化功能特性，极大地简化了我们在向量检索场景下构建业务系统的流程，其卓越的分布式扩展能力更是有效应对了数据量的持续增长，确保了系统的稳定运行。得益于Milvus的强大支持，我们成功推出了可私有化部署的应用平台，实现了客户真正的开箱即用体验，同时预留了灵活的空间，在现有需求未满足时，便于进行模型的进一步训练与优化。

目前，我们的平台已全面适配国产的NPU芯片，鉴于Milvus已展现出对GPU加速的良好支持，也期待后续能够支持到NPU以及多种其他芯片的加速。

并且最重要的是，我们的大模型开发平台即将开源，我们将会把技术成果贡献给社区，促进技术交流与共享。

Zilliz

Simply The Fastest Vector Database for AI. Period.

最新文章

手把手系列｜一篇文章教会你使用有RAG功能的CAMEL框架

客户案例｜Zilliz Cloud 助力 MindStudio 搭建无代码平台，革新 AI 应用开发方式

使用 Milvus、vLLM 和 Llama 3.1 搭建 RAG 应用

官宣：Zilliz 在亚马逊云科技中国区正式开服！

图像与文本并存，多模态检索如何带来新的搜索革命

聊一聊：你最想用大模型实现的功能是什么

引领非结构数据浪潮， Zilliz再度上榜Cloud 100 China榜单

聊一聊：你遇到最难忘的技术面试（内含福利与岗位内推）

如何评估 Embedding 模型

一文读懂，为什么向量数据库是大模型时代的核心基础设施

合碳智能 × Milvus：探索化学合成新境界——逆合成路线设计

使用 Milvus 和 Streamlit 搭建多模态产品推荐系统

聊一聊：大模型热潮，还会再火多久（内含福利）

Milvus 向量数据库进阶系列丨构建 RAG 多租户/多用户系统 (下）

聊一聊：Runway“删库跑路”，到底为什么（内含福利）

使用 Milvus Lite、Llama3 和 LlamaIndex 搭建 RAG 应用

扩博智能× Milvus：图像检索助力零售商品图像高效标注

向量数据库Milvus源码开发贡献实践

利用元数据过滤、Hybrid Search、 Agent 等功能提升您的 RAG 应用

聊一聊：工作中，你遇到过哪些堪比rm -rf的灾难现场（内含福利！）

使用 Ollama、Llama 3.1 和 Milvus 实现Function Calling 功能

手把手系列｜无需 OpenAI 即可搭建 RAG 应用（二）

Milvus在数派数据大模型业务中的实践

手把手系列｜使用Milvus、Llama 3、Ollama、LangChain本地设置RAG应用

Unstructured Data Meetup 南京场收官！干货指南：大模型、向量数据库和 RAG

直播预告｜从 BM25 到 SPLADE，稀疏向量如何优化 RAG

使用 Hugging Face 和 Milvus 构建 RAG 系统

聊一聊：用这招，一键去班味！（内含福利！）

博世（BOSCH）× Milvus：智能驾驶领域的数据挖掘革新

长文本与RAG——AI应用的双引擎

KubeSphere 部署AI向量数据库 Milvus 实战指南

8月17日，南京Unstructured Data Meetup还能报名！

聊一聊：什么职业绝不会被AI取代？（内含福利！！！）

Dopple Labs 选择 Zilliz Cloud 作为安全高效的向量数据库

聊一聊：为奥运健儿们打call！（内涵福利！）

面向 RAG 应用开发者的实用指南和建议

如何在生成式AI里使用 Ray Data 进行大规模 RAG 应用的 Embedding Inference

Milvus 向量数据库进阶系列丨构建 RAG 多租户/多用户系统 (上）

聊一聊：我在工位用AI...（内涵福利！！！）

对话 Zilliz 创始人 Charles：如何在AGI的浪潮下慢慢地快

聊一聊：这部科幻电影陪我度过了很多个周五（内涵福利！！）

Ivy.ai × Zilliz Cloud：构建 GenAI 驱动的聊天应用

一文剖析高可用向量数据库的本质

探索 Milvus 数据存储系统：如何评估和优化 Milvus 存储性能

Milvus × RAG助力快看漫画多业务应用

Milvus 向量数据库进阶系列丨部署形态选型

云启AI，数领未来｜Zilliz 华北地区高层闭门会圆满结束

Zilliz 推出 Spark Connector：简化非结构化数据处理流程

(内含福利!!) 8月17日，邀您共赴南京Unstructured Data Meetup！

活动回顾｜Unstructured Data Meetup 北京场

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉