2024年10月10日下午,由中国信通院云计算与大数据研究所、中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)共同发起,DataFun联合举办的“大模型时代数据开发实践分享沙龙”成功召开,行业专家进行了精彩分享。
本次会议由中国信通院云计算与大数据研究所牵头组织,邀请了来自腾讯云计算(北京)有限责任公司、联通数字科技有限公司、亚信科技(中国)有限公司、中国平安人寿保险有限公司、网易(杭州)网络有限公司、海南数造科技有限公司的专家深入探讨了大模型时代的数据开发技术变革以及相关产品和实践情况。中国信通院云大所高级业务主管王超伦主持了本次沙龙。
嘉宾:王超伦|中国信息通信研究院 高级业务主管
分享主题:大模型时代数据开发平台发展趋势及标准化工作介绍
中国信通院云计算与大数据研究所高级业务主管王超伦介绍了大模型时代数据开发平台的发展趋势及相关标准化工作。王超伦指出,随着《“数据要素×”三年行动计划》的发布,各行业都在纷纷统筹力量加快推进数据要素的开发利用,以发挥数据要素的放大、叠加、倍增作用。以大模型为代表的人工智能技术为数据开发工作注入了新的驱动力,大模型在数据开发领域的赋能效应受到了各方的广泛关注。
大模型具备的自然语言理解能力、内容生成能力、推理和决策能力可高效赋能数据开发链路的全流程,包括前期数据准备、开发及测试、数据任务运维等,提升了数据开发工作的效率和便捷性,降低了数据开发工作的门槛。演讲的最后对《数据开发平台技术要求与测试方法》标准进行了介绍,并对《大模型驱动的智能数据开发平台技术要求》进行了发布和解读。基于该标准的大模型驱动的智能数据开发平台专项测试也已推出,欢迎报名参与。
嘉宾:谭杰轩|腾讯云计算(北京)有限责任公司 高级产品经理
分享主题:腾讯云WeData大模型驱动的数据开发与治理平台智能化实践
腾讯云高级产品经理谭杰轩,以“腾讯云WeData大模型驱动的数据开发与治理平台智能化实践”为主题,介绍了腾讯云大数据数据开发治理平台WeData基于腾讯大模型混元,构建智能化升级方案,方案包含意图识别优化,利用RAG技术构建知识库,增强检索能力,并结合多种模型优化手段,如优化token压缩策略,提示工程拆分任务,指令微调等,实现了AI智能助手,支持SQL纠错,注释,生成等功能,提升数据开发效率。提升血缘分析通用能力,稳定性和准确率。实现数据资产智能化,提升数据资产分类效率和知识问答能力。提供数据安全智能化,提供更高效稳定的数据安全识别和风险监测能力。通过以上方面,构建智能化的大数据开发平台,实现Data+AI“双轮驱动”,有效提升数据开发效率和用户体验,加速企业数据价值释放。
嘉宾:高华超|联通数字科技有限公司 数据建模高级工程师
分享主题:中国联通大模型赋能数据开发创新实践
联通数字科技有限公司数据建模高级工程师高华超分享了中国联通大模型赋能数据开发创新实践,详细介绍了运营商数据架构,以及联通数科围绕数据科学基础研发组件库,数据科学基础资源库以及人工智能数据治理关键组件库构建的数据能力体系。分享重点提及了联通数科在大模型、RAG等技术方向的创新应用,并重点介绍了这些技术在数据开发领域的应用案例。
嘉宾:王立冬|亚信科技(中国)有限公司 产品规划
分享主题:基于大模型的数据开发与治理解决方案
亚信科技(中国)有限公司,以“基于大模型的数据开发与治理解决方案”为主题,介绍了亚信科技渊思•行业大模型产品体系。该体系通过聚焦“平台、模型、工具”三个层面,弥合了通用大模型与行业应用之间的鸿沟,为各行业和全场景应用提供全面赋能。
在此基础上,介绍了面向智能化数据开发及治理场景的数据管制副驾产品。该产品旨在对数据加工处理的各个环节进行注智赋能,具备数据开发智能服务、数据治理智能服务、数据运维智能服务以及数据智能问答服务功能。通过独立部署和数据中台嵌入式部署两种方式,能够有效地赋能数据管理平台,提升整体数据处理能力和效率。
嘉宾:乙峰|网易(杭州)网络有限公司 产品专家
分享主题:大模型时代数据开发产品新趋势
网易(杭州)网络有限公司资深产品专家乙峰,以“大模型时代数据开发新趋势”为题,围绕网易基于DataOps数据开发治理一体化产品方案进行展开,以及金融领域、工业领域和政务领域对大模型应用新探索进行深入讲解。分享了网易数帆在大数据资产管理领域的核心能力和方法论。重点介绍了网易在数据开发的两个重要探索:SQL Copilot和ChatBI,强调大模型在数据开发产品的应用应该聚焦在开发工程师提效方面。
嘉宾:鲍立飞|海南数造科技有限公司 研发总监
分享主题:创变未来-大模型时代的数据开发创新探索
海南数造科技有限公司产品研发总监鲍立飞深入探讨了大模型时代对数据开发的影响,并分享了数造科技在DataOps与大模型结合方面的创新实践。面对企业数字化转型中数据供需矛盾日益凸显的问题,DataOps被视为新的解决范式。而大模型强大的理解和生成能力,为数据工程提供了新助力。数造科技在需求管理、开发管理、测试管理等关键环节展开了DataOps与大模型的深度融合研究,基于一站式数据开发管控平台DataBuilder,数造科技推出的智能SQL开发助手功能,集成了代码生成、代码解释、数据建模、SQL改写、SQL优化及快速生成注释等能力,显著提升了企业数据开发的效率与质量。通过介绍数造科技产品在能源电力和制造等领域的成功应用案例,展示了其有效性和先进性。未来,数造科技将继续探索DataOps与大模型结合的更多可能性,优化平台功能,提升服务品质,助力更多企业实现数字化转型与智能化升级。
直播回放
首批大模型驱动的智能数据开发平台专项测试通过企业将在12月份2024数据资产管理大会颁发证书,此标准为“大模型+数据智能应用”系列标准之一,该系列标准如下,欢迎联系咨询!
《大模型驱动的智能数据分析工具技术要求》(已完成,开放测评)
《大模型驱动的智能知识图谱技术要求》(已完成,开放测评)
《检索增强生成(RAG)技术要求》(已完成,开放测评)
《大模型驱动的智能知识问答系统技术要求》(已完成,开放测评)
《数据智能体技术总体要求》(已完成,开放测评)
《数据分析智能体技术要求》(已完成,开放测评)
《大模型驱动的智能数据开发平台技术要求》(已完成,开放测评)
联系人:
王超伦
wangchaolun@caict.ac.cn
13011807607