为了讲清楚整合必要性这个问题 ,我们可以从两个角度来讨论:① 指标管理为什么需要对话式数据分析(指标+对话);② 对话式数据分析为何需要指标管理加持(对话+指标)。
指标+对话
交互性
数据理解深度
对话+指标
指标复杂性
对话式分析在处理非常复杂的数据分析时,可能受限于自然语言处理的能力。通过指标平台提供的数据挖掘和分析基础能力,整合平台能够处理非常复杂的数据定义和问题。
准确性
因此,对话式数据分析可以通过整合指标达到很高的准确率。
那么,如何整合对话和指标呢?
自然语言查询
用户可以直接用自然语言进行指标提问,比如“蓝牙耳机这个月的销售额是多少?”或“女性用户活跃度在过去一周有何变化?”对话式平台会通过AI理解这些查询并优先从指标中检索相应的数据。
当遇到指标检索不到的时候,平台还可以通过SQL生成能力,直接在指标平台中定义好的事实表和维度表上进行查询分析,或者直接在数据平台(数仓、数据湖、湖仓一体)进行查询分析。
上下文理解
对话式平台能够理解用户查询的上下文,提供最准确和相关的指标作为回答基础。例如,如果电商平台的运营用户问到某特定产品(如AirPods)的销售情况,对话式平台能够理解并关联到该产品的相关指标,然后提供一个最相关的回答。
多轮交互
用户可以通过对话式平台进行多轮交互,深入探索指标。例如,运营同学可能首先询问“本周AirPods总体销售情况”,然后进一步要求分析“北京、上海等特定地区”,或者“午间、晚间时间段的销售表现”。
数据可视化
结合指标数据服务能力和可视化能力,对话式平台能够将查询结果以图表或仪表板的形式展现,使用户能够直观地理解数据分析结果。
智能推荐
对话式平台可以根据用户的历史查询和行为模式,智能推荐相关的指标或数据洞察,帮助用户发现可能忽略的重要信息。
自动化报告生成
用户可以要求对话式平台基于特定指标生成报告。平台会从指标平台中提取数据,并结合自然语言生成能力,自动撰写包含关键数据点和分析的报告。
在上篇文章中,我们分享了对话式数据分析的四个特点:智能化、一站式、服务化、强实时。其中一站式主要整合目标就是指标管理和BI功能,而服务化的重点就是将指标管理形成服务赋能其他应用。
实现方案的核心:一站式+服务化
一站式
在以往的数仓或者湖仓平台中都是将表标准化,但这是不够的,指标的标准化才是实现可靠分析应用的关键。毕竟,用户消费的不是表,他们消费的是指标、维度和报告。
因此,对话式数据分析必须要统一整合指标及其维度,而不是传统的表和列。首先,指标的创建人需要提供核心的元数据,通过配置文件明确所有权、血缘和指标描述等信息。这些信息还可以用来训练和优化企业专属的大模型。
元数据属于公司知识库,然而在缺少指标层或者指标平台的情况下,元数据并没有明确记录下来,或者分散在各种BI工具中的图表定义里。通过整合指标层,所有定义都是受版本控制的代码,这些配置文件的修改也由组织内部审查和管理。
当所有下游BI和报表工具都开始使用指标层时,事件源和维度源就是统一和标准的,它们分别对应星型模式设计中的事实表和维度表。事件源定义了构建指标的原子事件,维度源包含可以与指标一起使用的属性划分。
服务化
服务化是一站式的具体实现路径,也是对话式数据分析平台的核心优势,它允许数据和应用功能之间通过API实现高效、灵活的交互。
这种以API为中心的方法简化了与其他BI工具或应用程序的集成,使用户能够轻松地获取和操作数据。
通过API,企业还可以根据自己的特定需求定制数据服务。这包括定制的数据查询、特定的报告生成或个性化的数据可视化。
往期推荐