谭云志,公众号:DataFunTalk腾讯基于 LLM 的智能数据分析平台 OlaChat 的落地实践
4. 问答环节
分享嘉宾|樊帆 腾讯 产品及增长负责人
编辑整理|张静瑜
内容校对|李瑶
BI 分析市场趋势
BI 和 LMM 的结合点
1. 智能 BI 的愿景与实现路径
业务问题翻译:将业务问题转化为数据分析问题。
数据资产定位:从数仓中找到需要分析的数据资产。
查询条件生成:生成相应的 SQL 或 Python 代码以获取数据。
分析结论总结:基于数据结果生成分析结论或决策建议。
自然语言处理与理解能力:
大模型的自然语言处理能力使用户能够用自己熟悉的语言来查询和分析数据,大大降低了数据分析的门槛,使非技术用户也能轻松上手。
大模型能够处理和分析非结构化数据,如客户评价和媒体内容,从而提取出有价值的信息和洞察,为企业提供全面的数据视角。
检索增强(RAG):大模型与 RAG 结合可以让检索的效果更加强大,能更精准地从大型知识库中找到和定位相关信息。同时在生成过程中也可以更好地复用知识库的信息,减少幻觉、提升准确性。
代码生成与自动化:大模型还能够通过自然语言指令生成 SQL 、Python 等编程语言的代码,使得即使是没有编程背景的用户也能够完成复杂的数据分析任务。
智能推理与预测:大模型可基于现有数据进行推理和预测,帮助用户识别数据中的异常点、趋势以及潜在的问题和机会。
2. 面临的挑战与解决方案
3. 业界领先产品的实践案例:Tableau 和 Power BI 的 Copilot 功能
4. 融入当前 BI 流程处理单点问题
案例:腾讯云大数据平台在 BI+AI 领域的探索与实践
1. Text2SQL 能力展示
选择表:根据用户选择的数据源范围,确定查询的数据表和字段。
理解用户意图:系统首先解析用户的自然语言输入,识别出具体的分析需求。
回填 SQL :基于解析的结果,系统自动生成符合用户需求的 SQL 查询语句。生成的 SQL 代码可以回填到 SQL 工作区,允许用户进行进一步的手动调整,以确保准确性和完整性。
2. Text2 界面化拖拽分析能力展示
自然语言处理:系统首先利用自然语言处理技术理解用户的查询请求。例如,用户可能会问:“腾讯视频的某一个剧集的播放次数是多少?”。
查询条件生成:基于解析的结果,系统生成适用于拖拽式分析工具的查询条件。生成的查询条件会被自动填充到拖拽式分析工具的工作区内,这样用户可以直接看到并操作这些条件。
用户微调与反馈:用户可以在拖拽式分析工具中对自动生成的查询条件进行调整,包括修改指标、维度或添加/删除过滤条件等。用户的每次微调都会作为新的训练样本反馈给模型,帮助模型不断学习和改进。随着时间的推移,模型能够更精确地理解用户的意图,并生成更加准确的查询条件,最终达到非常高的准确率目标。
3. AI 出图能力展示
数据字段分类与命名:AI 自动识别数据结果中的字段,将其分类为维度或指标。为字段生成易于理解的显示名,提高图表的可读性。
可视化组件选择:基于数据特性和用户的分析需求,AI 模型会推荐最适合的可视化组件,例如折线图、柱状图、饼图等。
图表配置与优化:AI 自动配置图表的辅助线、异常点标记等,无需用户手动设置。根据上述配置自动生成图表,提供直观的可视化结果。
结果解读:结合数据解读能力,对图表中的异常点进行标注,提供额外的洞察。
4. AI 数据解读
描述性统计:对数据进行基本的统计分析,如均值、中位数、标准差等。
异常检测:识别数据中的异常值或异常模式,帮助用户发现潜在的问题。
趋势预测:基于历史数据预测未来的趋势,支持业务决策。
归因分析:分析影响结果的关键因素,帮助用户理解数据背后的原因。
自动化分析:通过大模型自动执行上述高级分析任务,减少用户的操作负担。
结论总结:大模型会将分析结果进行总结,生成易于理解的报告或结论。
启发性输出:系统不仅提供数据结论,还会给出具有启发性的建议和洞察,帮助用户更好地理解数据。
不直接干预业务决策:尽管系统能够生成高级分析结论,但不会直接应用于业务决策,而更多是作为启发性的参考。
用户自主决策:用户可以根据系统的建议进行进一步的分析和讨论,最终做出业务决策。
避免幻觉和其他问题:考虑到大模型可能存在的幻觉或其他问题,系统不会直接干预具体的业务操作,如营销系统的投放策略。
5. 更智能的产品形态
基于规则和算法的信息:系统根据预设的规则和算法信息,向用户提供分析建议。这些推荐可以帮助那些数据基础较弱或缺乏分析思路的用户。
业务历史分析:通过对平台上的历史分析进行分析,系统可以根据时间戳等信息推导出业务问题的分析流程。这样,在用户完成一次分析后,系统可以推荐下一步应进行的其他分析,帮助用户形成具体的业务结论或获得启发。
引入数据阶段:在数据导入过程中,系统可以推荐合适的数据源和数据清洗方法。
描述数据阶段:在数据探索阶段,系统可以自动进行描述性统计,并推荐进一步的分析方向。
可视化阶段:在数据可视化过程中,系统可以推荐合适的图表类型和配置选项,以优化展示效果。
6. 独立产品可能的产品形态
多步分析流程:用户的分析思路通常是多步骤的,一个复杂的业务问题可能需要多个数据分析任务才能完成。分析命题画布可以很好地承载这种多步骤、分支逻辑的分析流程。
可视化与可操作性:画布形式允许用户直观地看到整个分析流程,并且可以在每一步中进行干预和调优。这种形式不仅提高了用户的参与度,还确保了每一步的结果更加准确,最终达到预期目标。
逐步引导与优化:通过上下游多步串联的形式,用户可以在每个环节中对结论进行调整和优化,从而使得下一步的操作更加精准和面向结果。
灵活性与控制:用户能够在整个分析过程中保持高度的灵活性和控制力,确保分析过程符合实际业务需求。
7. ABI 产品架构
问答环节
使用量:这是最直接的衡量体系,通过统计产品的使用频率和规模来评估其受欢迎程度;
留存率:留存率是衡量产品长期价值的关键指标。如果用户在一段时间后仍然继续使用产品,这表明产品确实解决了用户的问题,提供了实际帮助。高留存率意味着产品能够持续满足用户需求。
用户数量和使用次数的增长:随着 AI 能力的逐步落地,用户数量和产品的使用次数也在增长,这表明产品正在吸引新用户并增加现有用户的参与度。
准确率的持续优化:对于准确率有问题的场景,如 SQL 纠错等高频使用场景,通过日常分析用户查询和结果准确性,进行调优,以提升产品性能。
分享嘉宾
INTRODUCTION
樊帆
腾讯
产品及增长负责人
现任腾讯产品与增长负责人,主要负责 PCG 灯塔产品策划与增长相关工作。
毕业于香港中文大学,先后在百度、腾讯从事策略、数据产品经理工作,拥有 5 年 + 数据产品、数据驱动业务决策等方向业务背景和经验,期间完成多个产品 0-1 的孵化和推广,目前同时也在负责 ABI 创新方向的探索和落地。
往期推荐
AIGC 在蚂蚁保保险领域的应用探索
百川智能:深度学习大模型推理性能优化策略
统一元数据管理 - Gravitino 在 B 站的最佳实践
大模型与行业融合:推动钢铁、医疗、教育领域的智能化变革
多模态大语言模型领域进展分享
面向生成式 AI 的向量数据库:架构,性能与未来趋势
小红书去中心化内容分发技术
西门子利用 LLM 打造通用公司智能助理的实践
大模型+数据智能分析应用发展趋势及标准化工作介绍
LLM+BI:基于大模型的智能分析探索—— 智能运营:AI 驱动的泛娱乐客户业务洞见
点个在看你最好看
SPRING HAS ARRIVED