北京市科学技术研究院信息与人工智能技术研究所(以下简称“人工智能所”)与院科技情报研究所合作,在科技情报垂直大模型领域的研究取得了新进展。科技情报作为科技创新的重要支撑,对于指导科技发展方向、优化资源配置、提升决策质量具有不可替代的作用。随着科技情报数据量爆炸式增长,数据量大、更新速度快,如何快速、高效地处理和分析这些信息成为巨大挑战。传统的情报收集和处理方法效率低下,难以满足实时性、准确性的需求,需要引入新的技术手段来提升情报工作的效率和质量。
图1.《基于知识库的科技情报大模型撰写服务平台V1.0》软件著作权登记证书
人工智能所贾倪博士团队与院科技情报研究所合作,依托创新工程项目,研发完成基于知识库的科技情报大模型撰写服务平台,利用大模型技术提升科技情报处理能力。在模型建设方面,成功构建了支持不小于100K上下文长度的科技情报垂直大模型,建立了超过10万条数据的本地矢量数据库;提供了基于知识库的科技情报问答、专报撰写、提纲生成、简报生成能力,研发了科技情报多任务融合学习方法,学习情报问答、专报撰写等多任务之间的共性知识,进一步提升了模型效果。在系统集成方面,项目成果已集成到“科情头条”平台,提供了包括情报智能问答、智能简报、报告辅助撰写等功能的科技情报智能化服务。
图2.科情头条报告功能
图3.科情头条问答功能
图4.科情头条简报功能
通过大模型的应用,显著提升了科技情报文本的处理速度和分析深度,实现了对大量科技情报文本的快速处理和分析,节省了人力资源,提高了工作效率。利用大模型的问答和生成功能接口,项目为科技情报从业人员提供了更便捷的信息获取方式,通过智能问答、智能简报等功能,提供了及时、精准的信息服务,提升了用户体验。通过引入本地知识库和结果溯源技术提高了大模型输出结果的可信度和可追溯性。通过对模型输出结构合理性、流畅度、易读性、回答相关性、知识覆盖度、可靠性以及RAG检索内容相关性等多维度的评估,模型在各项指标上的性能均超过85%。目前相关成果已与院科技情报研究所共同申请并获得软件著作权1项,申请国家发明专利1项。
随着人工智能技术的飞速发展,相关产业正迎来革命性变化。人工智能所致力于复杂场景的多维智能感知与多模态信息处理、自主智能决策与智能体协同关键技术研究,并依托院创新工程、北京市自然科学基金、国家自然科学基金和北京市重点实验室,推动落实“人工智能+”战略,在垂类大模型及具身智能领域打造具有国内影响力的研究团队,更好地为北京国际科技创新中心建设服务。
(贾倪 文/图)
北京市科学技术研究院是北京市人民政府直属的综合性科研机构,坚持“创新立院、人才强院、服务兴院、开放办院”发展战略,秉承“科技让生活更美好”的价值追求,巩固提升智慧城市、生命健康、生态环境、分析测试四个优势领域,持续强化科技智库、科学普及两个特色领域,前瞻布局新材料与先进制造、信息与人工智能、生物技术与健康、新能源与低碳技术四个研发方向,成为城市治理体系和治理能力现代化的重要科技力量,高精尖产业技术研发和成果转化的重要支撑力量,国际和区域科技协同创新的重要推动力量,落实科技体制改革和先行先试政策的重要实施力量,全面融入北京国际科技创新中心建设、服务新时代首都发展。
如果你对北京科技、科普的
“大事小情”感兴趣,
就一定不要错过哦!
长按二维码关注我们