为什么对话式数据分析需要整合指标管理,必要性在哪?

文摘   科技   2024-08-08 11:53   北京  

为了讲清楚整合必要性这个问题 ,我们可以从两个角度来讨论:① 指标管理为什么需要对话式数据分析(指标+对话);② 对话式数据分析为何需要指标管理加持(对话+指标)。

指标+对话

 

  交互性  


传统指标平台通常需要用户具备一定的数据查询和报表生成技能,交互性较差。通过AI对话能力的加持,用户可以用日常语言进行查询,提高了交互易用性。


  数据理解深度  


在指标平台中,用户可能需要花费很长时间理解数据背后的逻辑和含义。通过多轮对话,AI赋能的平台可以主动引导用户深入探索数据,提供更深层次的分析。


对话+指标


  指标复杂性  


对话式分析在处理非常复杂的数据分析时,可能受限于自然语言处理的能力。通过指标平台提供的数据挖掘和分析基础能力,整合平台能够处理非常复杂的数据定义和问题。


  准确性  


对话式分析基于自然语言的理解可能存在误差,目前所有的大模型产品都没法做到100%的准确率。而对话式数据分析平台通过指标可以获得标准定义和服务,以及数据验证和校对,确保数据的准确性。


因此,对话式数据分析可以通过整合指标达到很高的准确率。


那么,如何整合对话和指标呢?


自然语言查询

 

用户可以直接用自然语言进行指标提问,比如“蓝牙耳机这个月的销售额是多少?”或“女性用户活跃度在过去一周有何变化?”对话式平台会通过AI理解这些查询并优先从指标中检索相应的数据。


当遇到指标检索不到的时候,平台还可以通过SQL生成能力,直接在指标平台中定义好的事实表和维度表上进行查询分析,或者直接在数据平台(数仓、数据湖、湖仓一体)进行查询分析。


上下文理解

 

对话式平台能够理解用户查询的上下文,提供最准确和相关的指标作为回答基础。例如,如果电商平台的运营用户问到某特定产品(如AirPods)的销售情况,对话式平台能够理解并关联到该产品的相关指标,然后提供一个最相关的回答。


多轮交互

 

用户可以通过对话式平台进行多轮交互,深入探索指标。例如,运营同学可能首先询问“本周AirPods总体销售情况”,然后进一步要求分析“北京、上海等特定地区”,或者“午间、晚间时间段的销售表现”。


数据可视化

 

结合指标数据服务能力和可视化能力,对话式平台能够将查询结果以图表或仪表板的形式展现,使用户能够直观地理解数据分析结果。


智能推荐

 

对话式平台可以根据用户的历史查询和行为模式,智能推荐相关的指标或数据洞察,帮助用户发现可能忽略的重要信息。


自动化报告生成

 

用户可以要求对话式平台基于特定指标生成报告。平台会从指标平台中提取数据,并结合自然语言生成能力,自动撰写包含关键数据点和分析的报告。


在上篇文章中,我们分享了对话式数据分析的四个特点:智能化、一站式、服务化、强实时。其中一站式主要整合目标就是指标管理和BI功能,而服务化的重点就是将指标管理形成服务赋能其他应用。


实现方案的核心:一站式+服务化


一站式

 

在以往的数仓或者湖仓平台中都是将表标准化,但这是不够的,指标的标准化才是实现可靠分析应用的关键。毕竟,用户消费的不是表,他们消费的是指标、维度和报告。


因此,对话式数据分析必须要统一整合指标及其维度,而不是传统的表和列。首先,指标的创建人需要提供核心的元数据,通过配置文件明确所有权、血缘和指标描述等信息。这些信息还可以用来训练和优化企业专属的大模型。



元数据属于公司知识库,然而在缺少指标层或者指标平台的情况下,元数据并没有明确记录下来,或者分散在各种BI工具中的图表定义里。通过整合指标层,所有定义都是受版本控制的代码,这些配置文件的修改也由组织内部审查和管理。


当所有下游BI和报表工具都开始使用指标层时,事件源和维度源就是统一和标准的,它们分别对应星型模式设计中的事实表和维度表。事件源定义了构建指标的原子事件,维度源包含可以与指标一起使用的属性划分。



服务化

 

服务化是一站式的具体实现路径,也是对话式数据分析平台的核心优势,它允许数据和应用功能之间通过API实现高效、灵活的交互。


这种以API为中心的方法简化了与其他BI工具或应用程序的集成,使用户能够轻松地获取和操作数据。

通过API,企业还可以根据自己的特定需求定制数据服务。这包括定制的数据查询、特定的报告生成或个性化的数据可视化。






往期推荐

偶数发布对话式数据分析平台Kepler,会聊天就会数据分析

一次讲清楚实时湖仓数据处理架构如何落地

《分析型数据库技术要求》标准发布,偶数科技等厂商深度参与


大模型、实时需求推动湖仓平台走向开放

Gartner发布2023年最新技术成熟度曲线,偶数科技位列湖仓一体代表厂商

OushuDB × 东方证券:数据仓库信创国产化最佳实践

从北京到南京:偶数在能源行业的数据迁移实践

信通院联合偶数科技等企业发布《云原生湖仓一体白皮书》


↑扫描上方二维码↑
拉你进入技术交流群

偶数成立于2016年,是国家级专精特新“小巨人”企业。专注于云数据平台产品和解决方案,自主研发云原生分布式数据库OushuDB及实时湖仓数据平台Skylab。总部位于北京,在上海、南京、广州、武汉等地设有分支机构。偶数服务了国家电网、中国移动、建设银行等众多世界500强客户。获得国际著名投资机构红杉中国、腾讯、红点中国与金山云的四轮投资,是微软加速器和腾讯加速器成员企业。被评为福布斯中国企业科技50强,Gartner Cool Vendor,IDC Innovator。



点击下方阅读原文获取行业报告

偶数
专注于云数据平台产品和解决方案
 最新文章