随着多模态技术的迭代进步,城市治理大模型能力边界不断拓宽,场景渗透率稳步提升。凭借出色的逻辑推理、内容生成等能力,大模型可整合城市治理流程中的多元数据,解决协同不足、治理效率低等难点问题,优化风险防控与决策分析过程,提升治理效率与精确度。然而,城市治理大模型在应用过程中依然面临场景需求模糊、能力参差不齐等挑战,亟需通过标准制定、符合性验证等手段为城市治理大模型部署实施提供指引。
中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度关注城市治理大模型技术的发展动态,依托中国人工智能产业发展联盟和人工智能关键技术和应用评测工业和信息化部重点实验室,联合业内专家共同编制了《面向行业的大规模预训练模型技术和应用评估方法 第19部分:城市治理大模型》标准,本标准结合技术方产品能力和应用方关注重点,旨在综合评估城市治理大模型的应用效能。标准自2024年4月启动编制,在标准框架设计、标准内容编写、标准文稿研讨及多轮修订工作中,得到了业界专家的广泛关注和积极参与。
为加速推进城市治理大模型应用落地,中国信通院现正式启动城市治理大模型专项首轮评估。
一
评估范围
评估依据《面向行业的大规模预训练模型技术和应用评估方法 第19部分:城市治理大模型》标准,围绕场景丰富度、能力支持度、应用成熟度展开评估,共计3个能力域,近30个能力项。
1、场景丰富度:评估大模型在基层治理、城市管理、城市运营体系下各类细分场景中的应用渗透率,如服务办事、网格管理、纠纷调解等场景;
2、能力支持度:评估对话交互、模型感知、信息检索、推理分析等能力在城市治理场景下的各项性能指标;
3、应用成熟度:评估数据完备性、模型可控性、服务可靠性等配套能力在城市治理场景下的完善程度,如数据集定制、模型输出控制、风险监控与应急处置等。
图1 城市治理大模型专项评估指标体系
二
评估流程
评估流程主要分为商务确认和技术对接两个部分,商务流程依次为参测意向沟通、验证流程申请和商务合同确认,技术对接主要围绕参测材料的准备、评价测试的实施及验证结果的评审展开。
图2 商务对接流程
三
时间安排
首轮报名时间:截至2024年11月20日
首轮结果发布:2024年12月中下旬
联系人
孟老师,13893360177
mengyue@caict.ac.cn
张老师,19852822678
zhangdan3@caict.ac.cn
- END -
2017年10月初,工业和信息化部正式批复中国信息通信研究院承建人工智能关键技术和评测工业和信息化部重点实验室(以下简称“部重点实验室”)。
中国信通院为进一步推动我国人工智能的工程化进程,依托部重点实验室成立了AI工程化推进委员会。委员会聚焦人工智能开发工具和平台,AI研发运营和管理,大模型应用,知识计算应用和AI数据集治理等技术方向,以产业活动、研究报告、标准和评估、最佳实践等手段,推动人工智能工程化相关的工具、系统、流程和治理体系的完善。
企业单位申请链接: