【金猿产品展】数势科技SwiftAgent——大模型驱动的智能分析产品

科技   2024-11-22 16:01   北京  





数势科技产品

该大数据类产品由数势科技投递并参与“数据猿年度金猿策划活动——2024大数据产业年度创新服务产品榜单/奖项”评选。




大数据产业创新服务媒体

——聚焦数据 · 改变商业




SwiftAgent是数势科技自主研发、基于大模型的人机自然语言式交互方式的新一代智能数据分析助手,能够帮助企业内大范围的业务和非技术人员通过简单问答快速获取数据指标和洞见,解读数据和生成报告,辅助智能决策。产品底层以国产大模型为基座,让用户以自然语言进行数据查询,再到指标和标签语义层完成意图的理解、任务对应关联关系并完成指标SQL转化,最终完成自助取数用数和分析报告,真正完成数据指标化、指标价值化的有效转化。
2024年重大更新升级


2024年5月17日,数势科技在InfoQ主办的举办的AICon全球人工智能开发与应用大会上发布智能分析产品SwiftAgent 2.0版本,在产品设计和功能上做了升级:

升级一:统一语义层的构建(Unified Data Semantics)

数势科技SwiftAgent 2.0构建了统一的指标与标签语义层,即Natural Language to Metrics+Label to SQL,解决大模型对业务语义难理解和幻觉的问题,提高取数、用数的准确性。

升级二:用户可干预(Human in the Loop)

数势科技SwiftAgent 2.0可通过更自然的方式引导用户,如当用户提出“我想看一下最近的销售情况。”这种模糊的数据查询,SwiftAgent会给出“最近7天销售额”、“本月北京地区销售额”等选项供用户选择,用户还可以根据提示重新提问,最终得到他真正想要看的分析内容。

此外,SwiftAgent 2.0还可以通过用户“点赞”和“踩”的反馈进行强化学习,不断纠正错误、调整查询,从而更懂用户所想所需,也让分析更准确。

升级三:持续反思学习(Continued Reflection Learning)

SwiftAgent2.0可将所有使用用户过往的问答分析沉淀到知识库,加上上文提到的强化学习结果,在之后其他用户相似的问询场景中,直接提供结论并提供思考过程。这种不断反思学习的能力,也发挥了大模型最大的特点。随着时间的推移不断进步,SwiftAgent2.0可以变得更加聪明、好用,并更贴近业务需求。

升级四:多源数据链接(Diverse Data Connection)

SwiftAgent2.0还实现了多源异构的数据接入,不仅能接数仓,还能导入文本、Excel、图片、音视频等非结构化知识,满足全面分析思路。如:“美国数据反映劳工市场有降温迹象,减息预期加强,推动金价上涨,导致黄金ETF产品持仓量持续升高。”

升级五:数据计算加速引擎 (Hyper Computing Acceleration)

SwiftAgent2.0采用了数势科技独创的数据计算加速引擎,可以实现秒级数据查询,真正实现实时的人机交互。

1)底层选用了StarRocks、Doris等数据分析引擎作为执行引擎,在大宽表查询、跨模型关联查询和物化视图等方面性能更好;

2)结合对数据加工和使用场景进行了一系列优化,提供基于视图的预计算能力和基于预计算结果的查询优化能力;

3)数据虚拟化技术,将数据定义和物理数据(业务)解耦,实现指标/标签灵活加工使用,无需排期开发。

2024年10月22日,数势科技在Swift国际银行业运营大会(Swift International Banker's Operation Seminar)2024年会上发布SwiftAgent 2.1版本,根据数十家目标客户需求分析,新增“自动生成行业报告”和“智能归因分析”产品功能,解决大金融和泛零售企业大模型在数据分析领域落地痛点。

应用场景/人群


使用人群:面向非技术人员,如金融机构内的投顾经理,或者茶饮连锁品牌的运营人员,督导等。

应用场景:以自然语言交互式的数据分析场景。

在生成式AI时代,企业亟需将这些进步转化为可操作的洞察力,以驱动决策和增长。在进行数据分析时,企业频繁面对各种复杂的分析需求。然而传统的NLP2SQL生成结果的准确率较低,困扰着大模型项目负责人。导致该困境的主要原因之一在于大模型数据分析是基于语言交互的方式,无法限制用户的提问方式,因此理解问题和生成结果的难度偏高。

以下通过一些来自用户的真实问题具体说明。含义清晰的单任务问题最简单。

例如“最近7天xx产品的订单总量是多少?”这个问题大模型理解起来比较轻松,因为这是一个单任务,并且订单量、产品、时间等指标比较明确。含义模糊的单任务问题对于大模型而言,难度也不大。

例如“xx产品今年累计卖了多少?” 大模型开始发挥优势,因为大模型擅长将模糊语义对齐标准语义。一些涉及多表数据处理的问题,开始给大模型增加难度。

例如“今年xx品牌在国内和国外的整体销量是多少” 国内外销量经常存在两张表,两个销量的字段都定义为sales_count,如果对每个sales_count都做标注的情况下,针对两张表做union all或者做关联的时候会导致生成的SQL结果不准确。这种情况采取的解决方案,是把所有数据通过数据模型打宽或预打宽,通过语义理解然后对齐到相应的指标字段。不限制问题长度的复杂问题带来更大挑战。

例如“xx品牌最近3个月国内销量最好的产品是哪一款?每个产品平均每月销量是多少?” 大模型需要先查询过去某品牌三个月每个产品的销量,再基于查询的结果找到排序最好的几款产品,然后根据第二步任务结果找到排序最好的产品,计算平均每月的销量。复杂且需要调用专业算法的ni问题最为困难。

例如“华北地区xx的效率月环比为什么下降了?” 大模型不仅要查上个月的数据,还要针对前一个月的环比数据作计算,并且判断是否下降。在此基础上,还要调用归因能力,归因的算法能力不是大模型本身所具备的,所以要通过插件化的方式让大模型去调度,把之前的结果做参数解析填充到对应插件里,并生成最终的结果。这就是数势科技SwiftAgent重点解决的应用问题。

产品功能


SwiftAgent是数势科技自主研发的创新型智能分析产品,它结合了最先进的大模型技术(LLM)和指标语义、标签语义的数据分析能力,应用RAG和AI Agent能力,帮助企业内大范围的业务和非技术人员通过简单问答快速获取数据指标和洞见,智能化解读数据和生成报告,辅助智能决策。

亮点特征如下:

1. 产品拥有思考、推理和多任务处理能力。结合Agent架构,赋能产品解决繁复分析任务难执行的问题,让非技术人员能够以自然语言交互的形式精准取数、高效用数,降本提效;

2. 分析过程用户可干预。允许用户对数据查询和分析过程进行干预。如可以纠正错误、调整查询,还可以对结果进行“点赞”或“踩”,让产品能够基于人机互动提升分析准确性;

3. 产品可反思优化。结合个性化知识配置和不断的运营让产品变得更适应用户需求;

4. 据源更全面。多源异构数据接入,包括非结构化信息与知识,如文本、图片、音视频、Excel等,满足面分析思路。

核心功能如下:

1. 多模态交互查询:支持文本、语音、Excel等数据类型输入,方便客户在移动端和PC端快速完成数据查询;

2. 归因洞察分析:支持用户通过对业务数据进行维度归因、因子归因、时间序列归因与相关性分析等多种洞察方法,完成数据波动归因;

3. 高级数据分析:支持对结果数据集进行如同环比、占比、排序和高级聚合等多种高级统计分析方式;

4. 图表自动推荐和生成:贴合用户问题,自动匹配生成多种分析图表;

5. 行业化报告生成:基于数据分析结果及行业微调大模型,生成贴合业务场景的行业报告。

产品优势


数势科技智能分析助手SwiftAgent的差异化优势是通过加入统一的指标与标签语义层,实现Natural Language to Metrics+Label API,解决大模型对底层业务语义难理解和幻觉的问题,数据分析准确率达98%+。同时,产品解决企业各部门数据口径统一的问题,有效避免数据脏乱差等现象,将传统的经验决策升级为以数据为核心的智能决策。产品重点帮助企业解决数据源单一、数据孤岛严重和使用门槛高等数据分析领域的主要问题。

服务客户/使用人数


此产品2.1版本已经成功上线,实现商业化落地的有中原银行、书亦烧仙草等金融、零售企业。产品已完成产品市场验证,未来3年将推进第二阶段智能化跨越。

市场价值


从定性和定量两个角度说明该产品的市场价值:

定性部分:

提高决策质量:通过自然语言处理的洞见帮助金融机构管理层和一线客户经理或投顾人员做出更明智的业务决策;

增强用户体验:智能界面和交互提升用户满意度,降低用户学习数据分析工具的门槛;

改善员工效率:自动化日常任务减少人力资源浪费,使金融机构一线员工专注于更高价值的工作;

促进知识共享:便捷地获取和共享信息,促进组织内部的知识流通;

优化流程管理:对工作流程的智能分析帮助发现并改进效率低下的环节;

加强竞争力:赋能金融机构快速响应市场动态和投资者需求,提升企业竞争力;

提高数据安全性:指标语义层结合大模型可以更有效地防止数据安全威胁;

改善风险管理:实时监控和分析有助于提前识别和缓解潜在风险;

增强透明度:使企业运营更加透明,帮助建立信任和遵守监管要求;

加强团队协作:通过智能提示和交互式分析促进技术与业务团队协作。

定量部分:

SwiftAgent的自然语言取数、自然语言可视化和自然语言报告生成等能力将极大提升企业管理者与内部一线员工对数据的消费能力。该类型取数和报告生成在金融机构的日常单任务开发周期为12-18小时,通过SwiftAgent可通过自然语言实现5分钟以内取数并形成调度任务;一般中大型企业,如金融机构(如银行、证券公司、保险公司等)每年需要开发约5000张类似报表(固定报表以及临时性取数工单),预计最多可节省11250人天工时,预估每年节省成本1500万。

相关评价


与数势科技携手后,实现了数据管理的根本性变革。现在,所有经营域的数据均源自统一的指标平台,这一举措确保了数据看板的一致性,统一了团队对数据的认知,并极大地简化了数据查找过程。针对那些缺乏现成看板的情况,我们提供了自助取数平台,使业务部门能够自主下载数据、进行分析,无需等待我们的开发团队,这一系列变革显著提升了业务部门的满意度。

——书亦烧仙草CIO王世飞

中信建投与数势科技合作,聚焦“指标与标签统一管理平台”建设,加强数据管理与数据价值挖掘,优化财富管理客户服务,促进服务体系快速迭代,提升公司的数字化发展水平。

——中信建投
经管委业务相关负责人

提示:直接点击文末左下角“阅读原文”链接可直达该产品官网页面。

产品所属企业·:数势科技

数势科技是行业领先的数据智能产品提供商,拥有在大金融、高科技制造和泛零售等领域的专业洞察力及技术实力,为全球优秀企业提供基于大模型增强的智能指标平台(SwiftMetrics)、智能分析助手(SwiftAgent)、智能标签平台(SwiftXDP)及智能营销平台(SwiftMKT)系列产品,提升企业的数字化决策能力,推动企业数字化升级。

数据猿
关注大数据产业的技术应用新媒体。数据猿致力于以大数据的产业应用视角,关注报道金融、工业、医疗、消费等为代表的全行业,并以大数据视角,重点关注人工智能与云计算领域。数据猿也将持续关注物联网、半导体、新能源等重要领域的大数据技术应用及发展情况。
 最新文章