开启“语料魔方”
市经济和信息化委员会、市卫生健康委员会、上海市疾病预防控制局近日共同发布上海市首个卫生健康语料库。语料库将致力于打造医学人工智能高地,按照专业化、适配性,立足最全知识体系、最丰富的场景适配、最广泛的数据来源,构建卫生健康领域具有前瞻性的高质量“语料魔方”,同步构建语料专项治理规程和工具链体系,推动卫生健康领域数据治理从基于规则到模型驱动的模式转变。
其中,市卫生健康委员会、市疾病预防控制局、市疾病预防控制中心在上海库帕思科技有限公司支持下,共同发布了上海市卫生健康行业语料库(临床医学)1.0版和上海市卫生健康行业语料库(公共卫生)1.0版。
1.0版聚焦基础资源、业务资源、主题资源三大类,细分至传染病动态监测、慢性病及其危险因素、免疫规划和疾病控制等61个科目。适配多样化应用场景,支持从基层社区到各级疾控中心的多层次应用需求,例如传染病监测预警、公共卫生风险处置、健康评估干预与服务等3大类15个典型应用场景,整合国内外公共卫生权威指南、行业知识库、行业数据库、行业场景库等4个维度的核心内容,语料规模达3TB。
《上海市发展医学人工智能工作方案(2025—2027年)》提出:当前医学和人工智能正处于快速融合阶段,成为国际科技竞争的新焦点。以大模型为代表的新一代人工智能加速发展,正在引领新兴产业和未来产业“范式创新”,加速整体性重构。MaaS作为一种新型人工智能服务模式应运而生。
后续本市还将面向基础医学、健康管理、药物研发、中医中药等领域不断发布完善行业语料库,推动卫生健康领域语料规模和结构质量持续迭代。同时将持续深化小模型+智能体、语料终端一体机等语料数据服务的模式创新,为行业拥抱人工智能和大模型构建全方位的语料数据能力基座,推动上海卫生健康领域从DATA4BI迈向DATA4AI时代。
据悉,上海未来还将有更多公共服务领域的机构和人工智能产业上下游企业加入并形成生态合力,同时基于平台具备的智算底座、算力加速、基础大模型、语料库、安全保障等全方位能力,帮助更多公共服务领域人工智能创新应用快速落地,构建市场转化运行的机制,推进优秀的人工智能应用场景实现产品化、市场化。
@转载自:上海发布卫生健康语料库1.0版,兼顾多病种覆盖100多个二、三级专科科目_解放网,上观新闻