作者|沙丘智库研究团队
来源|沙丘社区(www.shaqiu.cn)
▎案例1:中国移动大模型评测体系建设实践
面向生产服务场景,中国移动建立语言大模型、行业大模型、多模态大模型、智能体应用、安全评测等五大评测基准,围绕评测数据、指标、方法与分析三大要素,高效开展综合全面的大模型评测。通过构建模型评测平台,支持模型注册、模型管理、评测任务管理、评测场景管理、评测指标汇聚、评测数据管理、评测报告分析、模型能力排行等一系列工作,实现一键注册、快速评测、智能分析的大模型标准化评测流程。
完整内容:中国移动大模型评测体系建设实践
▎案例2:腾讯代码大模型评测方法与实践
▎案例3:工商银行大小模型协同的AI中台建设实践
工商银行从技术能力、应用能力、安全可信能力等维度,面向通识理解和金融实际应用,建立涵盖通识认知、金融认知、金融从业资格认证、实际金融应用任务的金融大模型全域能力测评标准,建成配套测评数据集并持续拓展更新,为金融大模型建设、验证、优化等工作提供重要参考和指导。
更多研究:
*更多生成式AI研究可前往“沙丘智库”小程序查阅
*有任何需求可咨询客服微信:zimu738