近日,由中国移动研究院中国移动技术能力评测中心(以下简称:评测中心)承办的全国信息检索挑战杯竞赛(CCIR 2024)圆满落幕。经过两个多月的激烈角逐,来自bilibili、北京邮电大学、同花顺等单位的三支队伍脱颖而出,分别斩获一二三等奖。
全国信息检索挑战杯竞赛是由中国中文信息学会(国家一级学会)举办,全国信息检索学术会议(CCIR)承办的我国该领域最高级别竞赛,致力于围绕信息检索领域实际问题探索解决方案,并为科研人员提供丰富的研究数据支持,迄今已成功举办十余届全国竞赛。
为推动大模型评测技术应用创新,评测中心发布“基于大模型的文本内容智能评判”赛道,旨在通过构建“大模型裁判”系统,克服传统自动化评估方法准确性差、泛化性低的缺点,避免人工评价效率低下、成本高昂等问题。赛道设置流畅性、规范性和正确性等多个评估维度,引导参赛选手借助大模型强大的语义理解能力和泛化能力,应对不同领域和场景的评判需求,精准对齐人类专家的评判标准,实现对创作文章、客观选择题等多类题型的评判工作,共同促进AI+大模型评测技术的发展和应用。
作为赛事承办方,评测中心全程参与了赛题准备、赛道设计、性能评估和技术评审等多个环节,确保了大赛的顺利进行。本次大赛共吸引来自产学研各界的近200支队伍参与,赛事期间,涌现出了一系列兼具实用性和创新性的优秀技术方案,在提升文本评判的精准性和评判效率等方面表现突出,不仅为解决业界难题提供了创新思路,也为评测技术的应用推广作出了重要贡献。
四年来,评测中心连续承办CCIR全国挑战杯竞赛,设计了包括“智能人机交互自然语言理解”、“通用事件属性抽取”、“基于通用大模型的知识库问答”等一系列高水平赛题,为人工智能技术进步和产业成熟做出了突出贡献。未来,评测中心将继续与产业界和学术界携手合作,推动大模型等人工智能新兴技术的发展与应用,为我国AI+产业发展贡献更多力量。
来源 | 中国移动研究院
我们百分百努力,愿您10分满意!