【提要】国家科学数据是新时期新质生产力发展的核心要素。促进科学数据要素化发展,有利于提升我国产业链供应链韧性和安全水平,是推进高水平科技自立自强的内在要求和有力抓手。“十三五”国家重点研发计划67个专项6000多个重点项目实施已有一个完整周期的实践,国家科学数据在体量和价值上具有要素化的必要性和充分性。本文结合新时代国家重点研发计划科学数据实践,从制度机制、专家队伍、经费预算和激励机制等方面,分析国家数据汇交的事前事中事后各环节对数据要素化的影响,并围绕提升我国产业链供应链韧性和安全水平,从科学数据要素强链补链延链提链角度,探索如何通过科技计划政策机制促进数据要素化并提出政策建议。
【关键词】科学数据;数据要素;数据汇交
新时代十年来,我国深入实施创新驱动发展战略,科技创新成果丰硕。党和国家高度重视数据要素流通。2022年6月,中央全面深化改革委员会第二十六次会议强调,数据作为新型生产要素,是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各个环节,深刻改变着生产方式、生活方式和社会治理方式。在各类数据要素中,科学数据是基础性战略性数据,是新型生产要素的核心成分。我国科学数据要素存量大且增速快。国家统计局、科学技术部和财政部2023年发布的《2022年全国科技经费投入统计公报》显示:2022年,全国共投入研究与试验发展(R&D)经费30782.9亿元,比上年增加2826.6亿元,增长10.1%。国家财政科学技术支出11128.4亿元,比上年增加361.7亿元。其中,中央财政科技支出3803.4亿元,占全国财政科技支出比重为34.2%;地方财政科技支出7325.0亿元,占比为65.8%。科学数据要素积累丰富,及时将科学数据要素在内的科技创新成果,应用到具体产业链上,加强国家科学数据要素与产业数据融合发展,促进数字经济和实体经济深度融合,已成为大势所趋。党的二十届三中全会审议通过的《中共中央关于进一步全面深化改革、推进中国式现代化的决定》提出:要“建立产业链供应链安全风险评估和应对机制”,“建设和运营国家数据基础设施,促进数据共享”。2024年6月,习近平总书记在全国科技大会、国家科学技术奖励大会、两院院士大会上讲话指出,要“扎实推动科技创新和产业创新深度融合,助力发展新质生产力。”
这为新时代国家科学数据工作指明了前进方向、提供了根本遵循,也为国家科学数据要素化研究提出了新命题。
笔者结合2015年以来参与国家重点研发计划项目咨询评审和国家科学数据中心的工作实践,对国家科学数据要素化进行探索性思考,提出通过强链补链延链,共同推进国家科学数据要素化工作,促进新质生产力发展。因篇幅所限,本文重点论述国家科学数据要素化的“补链”,这也是目前相关理论研究和实践工作探索中令人困惑的空白。为了论述的方便,本文将“十三五”国家科学数据全生命周期划分为三个阶段:将国家重点研发计划项目数据汇交方案实施至获得项目组汇交凭证,称为“事中”(通常为4周~8周)。项目组获得汇交凭证之后,称为“事后”。项目数据汇交方案实施之前,主要是指从项目组拟定申报选题和组织编写申请材料、正式立项至准备项目综合绩效评价,简要地说,就是从组织项目申报至项目审计基准日这段时间,称为“事前”。“十三五”国家科学数据汇交工作主要集中在“事中”。而“事后”配置资源较少,“事前”配置的资源就更少了。国家科学数据要素的全生命周期,是一个长长的链条。我们不仅需要做好“事中”,要通过国家科学数据标准化、国家科学数据政策机制等对“事中”进行“强链”工作。同时也要“补链”,把国家科学数据要素化基本处于空白的“事前”补上;当然也要“延链”,把“事后”工作也做好。通过强链补链延链,来不断提升国家科学数据要素价值链。
(二)文献综述
国家科学数据的主要来源是中央财政投入的科研项目,包括国家科技重大专项(含科技创新2030—重大项目、重大专项接续项目、面向2035的重大项目等)、国家重点研发计划专项、国家自然科学基金项目等国家科研项目,以及国防和军队建设科研项目等。在组织机制方面,项目承担/参与单位、项目专业管理机构、国家科学数据中心等是科学数据要素化的关键主体。根据国家科技基础条件平台中心、中国科技资源共享网下设的国家科学数据中心网站(https://www.escience.org.cn/data-center)发布的信息,截至2023年底已进行科学数据汇交或数据集汇交的项目已超过6000项,为国家科学数据要素化研究积累了丰富资料和实践经验。学者们从国家科学数据汇交、科学数据要素化、科学数据管理等不同角度进行分析,对国家科技项目和数据要素进行了研究,并取得了丰富的学术成果。
一是国家科学数据汇交。主要有宏观分析、数字技术分析和专项层面分析三种。(1)宏观层面分析。徐波、王瑞丹、王卷乐等(2021)[1]结合国外科研项目数据汇交管理经验,辨析我国科技计划项目数据汇交过程中的重要责任主体,提出科技计划项目科学数据汇交的通用流程及汇交的主要内容。(2)数字技术角度分析。徐墨庚、姜晓轶、童心等(2023)[2]提出了基于区块链的科学数据汇交存证解决方案,结合科学数据汇交系统设计存证智能合约,实现汇交全流程可追溯。(3)从领域角度分析。国家重点研发计划已设立一百多个重点专项,结合具体专项进行某一个领域的数据汇交文献较多。王雪艳、井艳玲、赵爱芳(2022)[3]对2020年度基础医学领域某一批次29个项目科学数据的总体特征进行了实证分析。陶毅、苏爽、赵正宜等(2022)[4]基于元数据理念建立分层架构的计量科学数据汇交系统,并在标准化、技术、数据共享生态、数据市场化配置等4个方面提出发展建议。陈军、李大博、杨智君等(2021)[5]以国家重点研发计划计量科研项目为例,从承担单位的视角探索科研项目的科学数据类型、汇交流程和信息系统设计。白燕、杨雅萍、王祎(2020)[6]系统分析1999—2018年国家科技基础性工作专项资源环境领域已立项项目的类型与数量年度变化情况、项目数据汇交的进展以及汇交的数据资源内容特征。林海、王卷乐(2008)[7]梳理了国家重点基础研究发展计划(973)资源环境领域项目数据汇交情况。
二是科学数据要素化相关研究还在起步阶段,成果较少,需要着力加强。肖旭伏、仪彦(2024)[8]分析了我国科学数据在价值链上的流通与利用面临着要素配置、标准实践、隐私安全、资产核算4个方面的瓶颈。王漪、康林冲、姜晓轶等(2023)[9]分析和梳理了国内外科学数据流通交易的政策、理念、模式以及实践经验。杨雪梅(2023)[10]从数据市场培育、数据权属确认、数据价值评估三个维度,分析了高校图书馆数据开放共享的可行性。
三是国家科学数据管理相关研究成果较多。
(1)从要素流动视角探索科学数据汇交风险防控。杨成、申其辉(2023)[11]认为,要增加科学数据要素的流动性,促进科学数据与产业数据衔接,尽早尽多创造价值。应从认可制度体系、技术标准引领、服务数字经济、网络信息安全等多角度探索创新发展。郭华东(2024)[12]认为,实现科学数据“保护-利用”的动态平衡,最大化科学数据价值和最小化数据风险,最终达成推动科学探索和人类福祉发展的数据治理目标,将是学术界持续思考与探索的重要议题。廖方宇、李婧、龙春等(2024)[13]认为,“数据无序流转引发重大安全风险”,分析了数据交叉融合安全存在的高隐藏性风险,探讨了AI for science为数据安全带来新的风险。数据隐私风险是关注的热点,这方面的研究成果较多,如杨渝、王炜、陈世武(2024)[14]讨论了如何在保持效率的同时减少隐私泄露风险。特别是,涉外科学数据风险研究也得到了学者们高度重视。魏鑫、孔丽华、汪洋(2024)[15]讨论了科学数据出境中的风险挑战。李宜展、董璐、王东瑶等(2024)[16]提出,在国际科技合作计划中要综合考虑风险管控等技术因素,实施真正意义上的“对等”交换。
(2)从组织机构角度来研究不同领域科学数据风险。王佳荣、周彩秋、苑新阳等(2024)[17]综合考虑高能物理科学数据的敏感性、价值、存储和传输方式、访问控制、网络安全、合规性需求等多个因素,提出主要安全风险分为数据完整性破坏、数据机密性破坏和数据可用性破坏三类,并提出相应的风控策略。戴力新、戴琦(2023)[18]分析了我国科学数据中心内部运行机制,从组织管理、资源支撑、数据规范、数据安全、数据共享、产权标示、交流合作7个方面提出我国科学数据中心运行的基本框架。张胜发、马玉环、张敬晨等(2023)[19]基于健康医疗科学数据安全相关法律法规或政策要求,构建健康医疗科学数据分级指南,提出健康医疗科学数据分级的具体原则、评级规则与实施步骤。支凤稳、赵宇晨(2021)[20]从国家、地方和具体领域3个层面分别选取具有代表性的科学数据汇交政策,剖析数据汇交管理、政策创新性、汇交评价体系、激励机制等方面存在的问题。阮冰颖、刘桂锋、刘琼(2022)[21]认为,政策、平台和科学数据价值对科学数据安全的作用较明显。刘桂锋、马昕玥、刘琼(2023)[22]提出,要推动科学数据由资源到资产的转化,更好地发挥科学数据在科学研究及生产生活中的社会价值和经济价值。
(3)从组织结构和政策机制角度分析。苏靖(2022)[23]从处理好数据治理与价值实现之间的关系、处理好公益性与市场化的关系、处理好开放共享与安全保密之间的关系、处理好国内共享与国际合作的关系4个方面对加强和规范我国科学数据管理提出对策和建议。石蕾、高孟绪、徐波等(2022)[24]在调研欧美等国家具有较强影响力的科学数据中心建设发展情况的基础上,总结数据中心在数据库建设、数据管理应用服务平台研发、数据全生命周期管理、数据服务等方面的特点,提出加强我国科学数据中心建设的建议。王瑞丹等(2022)[25]在分析科学数据中心学科领域、层次级别、地理空间位置分布、发展阶段、隶属系统等异构性特征和学科动态发展、国家政策变化、科学数据中心工作重点等动态特征的基础上,提出科学数据中心运行状况评价模型。王芳、卜昊昊(2022)[26]从政策发展历程、政策利益相关者责任、政策主题相似度及关键内容要素等方面对美国、英国、澳大利亚和中国的181份科学数据管理政策进行分析与比较。徐淋楠、段美珍、寇晶晶(2022)[27]基于信息生命周期管理模型,从制度、技术、设施、人员4个要素出发对科学数据在存储、管理、应用3个层面的安全问题进行归纳,提出我国政府应从宏观层面完善以数据安全为核心的基础性制度建设。姜鑫、王德庄(2022)[28]阐述了参与开放科学数据的众多利益相关者之间政策协同的必要性,提炼利益相关者之间的政策协同观测要点并构建政策协同评估体系,利用质性文本分析法针对多个利益相关者之间的政策协同程度展开评估分析。阳巧英、夏义堃(2023)[29]构建基于政策引文、政策主体与政策主题的三维分析框架,运用文献研究法、社会网络分析法探究2001~2022年中央级科学数据政策的结构特征与演进逻辑。丁晓芹、汤怡洁、徐雯(2023)[30]认为,数据汇交政策体系和长期投入机制尚待完善、科学数据管理载体建设尚待落实、科研工作者对科学数据汇交意识有待提高以及科学数据汇交质量需要加以约束。
综上所述,从数据汇交的关键节点(开具汇交凭证)来说,关注事后的研究成果多于事前的。科学数据中心收到国家重点研发计划项目组上交的科学数据,根据有关规定组织专家组评审,认为合格之后,就出具的汇交凭证。这是一个科学数据汇交工作的关键节点。项目完成科学数据汇交工作,并获得科学数据中心出具汇交凭证之后的相关问题,不少国家科学数据研究者开展了深入研究,并涌现了大量的成果。在国家科学数据全生命周期中,已有的国家科学数据研究,对项目实施过程中的科学数据要素化关注还较少。因篇幅有限,本文没有全面论述国家科学数据要素化全生命周期的各种因素,重点讨论的时间段是从项目年度指南撰写至科学数据汇交凭证出具之前,影响科学数据要素与产业数据流动融合的现象和因素。为促进新质生产力核心要素高质量流动,提升我国产业链供应链韧性和安全水平,进行探索性分析并提供措施建议。
我国国家科学数据来源于中央财政科技支持的科技项目。从科技计划类型来年,“十三五”“十四五”国家科学数据主要来源是国家重点研发计划项目。根据项目牵头承担单位、项目参与单位、国家科学数据中心和各级科技主管部门等在网络发布的项目启动会、综合绩效评价等信息,若2022年~2024年立项的国家重点研发计划项目不纳入统计,而只统计2016年至2021年期间立项的国家重点研发计划项目,截至2024年6月,已完成项目综合绩效评价工作和完成科学数据汇交的项目超过6000个。这些鲜活生动的丰富案例,可帮助国家科学数据要素化研究,找准项目实施关心的实际问题,剖析项目实施过程中的困难诉求,为切实帮助解决实际问题提出有针对性措施建议。
(一)在“十三五”国家重点研发计划项目实施的前期和中期,科学数据质量管理机制处于创制初期
国家科技项目管理制度改革与发展对科学数据要素流动效率,具有重要影响。科学数据管理机制在“十三五”是边干、边建、边用中不断丰富和完善的。2014年《国务院印发关于深化中央财政科技计划(专项、基金等)管理改革方案的通知》(国发〔2014〕64号)启动新时期国家科技体制改革。2015年《中共中央 国务院关于深化体制机制改革 加快实施创新驱动发展战略的若干意见》下发,明确指出从8大方面30个领域着手,推动创新驱动发展战略落地。2018年国务院办公厅印发《科学数据管理办法》(国办发〔2018〕17号),对科学数据建设和发展进行战略部署,为国家科学数据要素化提供了政策依据。根据“十三五”国家重点研发计划67个专项工作实践分析,一个重点专项的实施周期有可能跨时7年左右,主要包括以下8个步骤:(1)部际联席会议审定专项动议→(2)专项实施方案审定→(3)年度指南编制、评估和发布→(4)项目申报→(5)项目立项评审(含项目任务书审定)→(6)项目过程管理(含实施周期3年以上项目的中期检查)→(7)项目综合绩效评价→(8)“回头看”抽查,等等。因新冠疫情影响,科技部安排一批项目统一延期。在正常情况下,一个重点研发计划项目的执行周期通常是3年~5年,少数项目因申请执行延期,有可能会超过6年。因特殊原因而项目组主动申请中止或被专业管理机构中止的项目只占极少数。
在“十三五”的头三年(2016年~2019年)国家科学数据制度和标准化建设处于探索初期,之后的三年(2020年~2022年)处于新冠疫情特殊时期,也是“十三五”重点研发计划项目科学数据汇交的高峰期,在探索中前进,难免遇到数据汇交和数据质量控制的一些新问题。“十三五”国家重点研发计划项目从2016年开始评审立项。两年后国务院办公厅印发《科学数据管理办法》(国办发〔2018〕17号)。在2016年和2017年立项的重点研发计划项目任务书中,并没有全部要求项目组签订数据汇交协议,不少项目组在项目任务书设计初期,也没有选定拟汇交的国家科学数据中心。2019年,科技部、财政部对原有国家平台优化调整(国科发基〔2019〕194号),形成的20个国家科学数据中心在抓紧进行相关制度和标准建设后,迅速承担了国家重点研发计划重点专项的科学数据汇交工作。2020年开始有大批国家重点研发计划项目进行数据汇交。从时间维度来看,“十三五”国家重点研发计划项目实施初期和中期,科学数据质量管理机制处于创新建设初期,有些项目的科学数据制备过程中缺乏数据汇交相关技术标准规范,这类项目如何加快实现科学数据共享,促进高质量向产业企业流动,有待在未来国家科学数据工作得到解决。
(二)在“十三五”国家重点研发计划项目实施全生命周期,国家科学数据中心参与度不够
国家科学数据中心在促进科学数据与产业数据融合中承担极其重要角色,应覆盖科学数据的全生命周期。但从“十三五”67个专项6000多个重点项目实施的全生命周期来分析,国家科学数据中心参与不够深入。原因是多方面的,一些重点专项2016年、2017年和2018年部署了其实施方案的半数以上任务。而2019年在全国成立的20个国家科学数据中心,进行相关制度和标准建设一年左右,很快迎来数据汇交高峰期(2020年~2022年)。到2023年,“十三五”立项的大部分重点研发计划项目,完成了项目综合绩效评价和科学数据汇交。可是,受三年新冠疫情影响,科研活动交流总量减少了,国家科学数据中心与各项目组的交流也相应减少,信息不对称现象较为突出。另外,国家重点研发计划项目涉及的组织机构众多,包括项目管理专业机构、推荐单位、项目牵头承担单位、参与单位、外协单位、监督单位、数据汇交单位等。根据国家重点研发计划管理制度安排,在项目综合绩效评价打分表的第3栏中提到了“数据共享”。通常是要求完成项目科学数据汇交,获得国家科学数据汇交凭证之后,才能进行项目综合绩效评价。项目组可在20个国家科学数据中心中自主选择拟汇交数据的国家科学数据中心。具体的汇交常要提前4周~8周与国家科学数据中心联系。很显然,国家科学数据中心在项目实施的初期和中期,并没有处于主导地位,难以及时获得项目实施进展和科学数据制备信息。
根据国家重点研发计划管理要求,项目牵头单位要在项目结束期(审计基准日)三个月内,给国家科技管理信息系统公共服务平台上传相关技术任务资料(财务审计相关资料,由会计事务所上传)。有些项目组是在审计基准日之后的两个月,才进行课题级综合绩效评价,也有在临近项目执行期结束时,才选定拟汇交的国家科学数据中心。项目数据汇交准备时间比较仓促,质量控制流程标准化程度有待高,影响了国家科学数据汇交质量和要素化活动。在一些项目实施的大部分时间里,国家科学数据中心没有及时参与项目科学数据的制备过程,实时掌握项目数据质量信息较少。因此,国家科学数据中心在后期加工处理这类项目科学数据时,可能因项目数据质量信息不对称而处于被动状态,提供共享服务难度较大,数据要素化时效性受影响。
(三)科学数据汇交专家在项目咨询专家群体占比较低,项目实施过程中参与偏少,科学数据相关信息沟通渠道待拓宽
根据新时期国家重点研发计划实施情况分析,专家咨询和评审制度贯穿项目的全生命周期,从专项年度指南编制到项目完成综合绩效评价,以及之后的“回头看”监督检查环节,各类专家都发挥重要作用。可以说,在国家科学数据信息渠道建设初期,专家群体是不同重点专项、不同项目组之间信息传递的非常重要载体。从组织形式上来看,各种会议是实施“十三五”国家科技计划项目的数据信息交流的重要形式。根据笔者对2016年~2023年国家重点研发计划112个专项的7600多个重点项目统计分析,与项目咨询专家相关会议主要有两类:第一类是科研制度明确要求的:立项评审会、项目任务书考核指标审定会、项目启动会、中期检查会(3年及以上项目)、项目综合绩效评审会、项目年度指南评审会、课题综合绩效评审会、数据汇交评审会等。第二类是弹性要求的,如技术任务、经费预算、管理制度和数据汇交等咨询评审会。在各种会议中,培训会和评审会是其中两种常见形式。在培训会方面,为了顺利实施“十三五”国家科技计划项目,科技部项目专业管理机构、项目牵头承担单位、课题承担单位和参与单位,都会组织项目技术、经费和管理等相关培训活动。国家科学数据中心也参与或主动组织科学数据汇交培训活动。如2021年初,笔者受科技部项目管理专业机构邀请,参与重点研发计划重点项目的数据汇交培训讲课。但总体来说,科学数据汇交培训活动与其他培训相比,次数较少且频率较低。还有,科学数据汇交专家在项目咨询专家群体的比例不高,参加项目组综合咨询活动比较少。根据笔者对2016年以来3500个重点项目启动会、综合绩效评价会在网上发布的新闻稿统计分析,数据汇交专家占比不足1%。这导致不少项目组成员对数据汇交标准和管理要求了解不及时不充分,影响了项目实施过程中科学数据制备质量控制。在组织评审专家对项目进行评审之前,组织单位通常会评审专家进行培训,宣贯最新科技政策和管理要求,主要是针对技术考核指标要求和经费执行要求来宣贯,对科学数据汇交的内容涉及较少。在项目牵头单位组织课题综合绩效评价时,与项目组在国家科技管理信息系统公共服务平台上传最终验收评审材料,还预留一段时间,因此在课题综合绩效评价过程中,较少对科学数据汇交作出硬性要求。更多的是在课题综合绩效评价会议之后,主要由项目组根据情况处理。或者说,在课题综合绩效评价会议及其之前,项目实施的大部分阶段,科研人员和咨询专家都较少关注科学数据汇交,对“交什么”“怎么交”不一定十分精楚。没有足够时间提前准备科学数据汇交工作,相应的数据质量管理容易受到影响。
(四)科学数据费用很少纳入项目经费预算,数据汇交质量管理经费支持不足,数据要素化激励力度不够
提高国家科学数据质量,相应预算经费是保障其与产业数据融合发展的前提。负责国家科技平台建设、管理和服务等领域标准化工作的全国科技平台标准化技术委员会(TC486)做了大量的工作,25项国家标准已正式发布,相关标准为科学数据汇交、科技平台建设等工作提供了重要的技术保障。在研制技术标准质量的同时,也应关注国家科学数据标准化实施的成本收益问题。或者说,应关注如何增加国家科学数据质量控制配套的专项经费问题。科技部、财政部和相关科技项目管理部门按照《中共中央办公厅 国务院办公厅印发〈关于进一步完善中央财政科研项目资金管理等政策的若干意见〉的通知》和《国务院关于优化科研管理提升科研绩效若干措施的通知》等精神,分别修订相关科技计划项目和经费管理办法。这类改革措施适合于所有国家科技计划,相关机制在不断完善中。科学数据提交方(科技计划项目的牵头承担法人单位)的数量,根据由科技日报社主办的微信公众号锐动源、项目参与单位等发布信息的不完全统计,“十三五”国家重点研究发计划项目的承担/参与单位众多,若计入课题牵头单位、任务牵头单位,则逾10万家单位。若把“十二五”国家科技资源专项数据汇交单位也纳入统计,科学数据提交方的数量就更多。科技计划项目管理方(8个项目管理专业机构)和科学数据管理方(20个国家科学数据中心),面对涉及专业众多、海量科学数据资源,很难及时为数量很大且涉及面广的科学数据服务共享方,提供定制化的国家科学要素流动服务。一些科学数据制备方获得的专项经费偏低。根据由科技日报社主办的微信公众号锐动源发布信息整理,“十三五”国家重点研发计划有6千多个项目立项。截至2023年底,大部分“十三五”期间立项的国家重点研发计划项目,已经进行了项目综合绩效评价。然而,从科技项目资金评议工作实践来看,科学数据要素流动缺乏稳定的项目专项经费支持。虽然有部分专项中有示范应用的项目经费支持,但是明显不足于支持科学数据要素向企业进行规模化流动所需的费用成本。很多国家科学数据在项目综合绩效评价结束之后,大多存储在国家科学数据中心或项目牵头单位,后续的科学数据要素化活动缺乏相应政策细则和专项资金有力支持。
根据国家重点研发计划的相关规定,技术任务的综合绩效评价是以“项目”为单位进行评审结论的,而经费预算的绩效评价是以“课题”为单位分别打分数的。从资金评议角度进一步深入分析,“十三五”国家重点研发计划中除少数项目(如青年科学家项目、国际合作项目等)没有下设课题之外,大多数项目都下设课题,其中下设4~6个课题的较多。每个课题也通常会设若干个子课题(项目组内部通常称为“任务”或“子课题”)。这样,一个项目组有6~20个参与单位也比较常见。从经济学激励约束理论来看,项目、课题或任务的承担单位、参与科研人员需要得到应有的报酬,才能持续激励进行科学数据质量控制和后续的数据要素化活动,科学数据与产业数据相互融合发展也才更有保障。在“十三五”国家科技政策和专项经费预算审计规则中,还没有细化到国家科学数据质量控制和要素化成本的层面。特别是,部分任务参与单位获得专项支持力度较小,国家科学数据质量控制激励机制不足。有些项目获得超过千万元或百万元专项资金支持,但细分到具体的任务参与单位后,有的参与单位在项目实施的3~5年内,得到的专项资助可能不足10万元。这些情况对国家科学数据要素化的影响,还需要各界深入思考,并在未来科学数据要素化实践中加以完善。
2022年新版《中央财政科技计划项目(课题)结题审计指引》对科学数据要素关注少,各方在执行过程中对相关支出理解也有待统一。《科学数据管理办法》(国办发〔2018〕17号)规定,政府预算资金资助的各级科技计划(专项、基金等)项目所形成的科学数据,应由项目牵头单位汇交到相关科学数据中心。2018年,《中国注册会计师协会关于印发〈中央财政科技计划项目(课题)结题审计指引〉的通知》对“科学数据”的相关要求不够具体。国家政策也没有明确规定数据汇交过程中经费支出。“十三五”20个国家科学数据中心作为数据管理方承担的国家重点研发计划项目科学数据汇交,数据存储、管理和开放共享主要是公益性服务。项目的《科学数据汇交计划》等应在国家科学数据中心形式审核通过后,组织同行专家评审,对《科学数据汇交计划》是否符合项目任务书规定的研究内容、考核指标,以及项目实施的实际情况等作出专业判断;对汇交数据的科学质量进行评估,包括数据的真实性、准确性和可用性等方面。2022年6月,中国注册会计师协会发布的《中央财政科技计划项目(课题)结题审计指引》,也还没有涉及到此问题,还有待在“十四五”和“十五五”项目实施中探索解决。
我国科学数据要素资源存量大增速快,国家和地方科学数据要素资源的存量已超万亿元,但科学数据要素利用率有待提高,科学数据要素与产业数据相互融合的激励机制乏力。提高科学数据要素生产质量和流动效率,需要解决的问题比较多,如专业领域科学数据技术标准等共性技术支持不足、知识产权问题、科学数据价值创造与利益共享机制不健全,数据要素采集加工的持续性与项目经费供给的阶段性矛盾等。迫切需要将科学数据要素纳入各级科技计划项目资金管理范畴,并为提高科学数据要素化提供相应资助,促进科学数据要素与产业数据相互融合发展。目前已有一些相关政策出台,如2021年,《北京市科技计划项目(课题)经费管理办法》(京财科文〔2021〕1822号)提出,“财政科技经费形成的大型科学仪器设备、科学数据、自然科技资源等,在保障有关参与单位合法权益的基础上,按照国家和北京市有关规定实施开放共享,提高资源利用效率。”但操作层面细则还在完善中,导致科学数据要素资源存量大增速快,利用率却不高。
(五)科学数据特殊性与产业数据规模化应用要求,数据要素收益不确定性大,不同利益主体协调有难度
有些项目在实施过程中,科学数据与产业数据深度融合应用进展顺利。如“乡村产业共性关键技术研发与集成应用”重点专项聚焦特色产业,研发并集成应用乡村产业共性关键技术,推动先进适用技术向乡村下沉。该专项在设计重点项目时,将科学数据与产业数据深度融合应用作为硬性要求。然而,在实践中,我们也会遇到因项目参与单位利益问题,造成科学数据与产业数据难于融合的现实难题。笔者在参加重点研发计划项目实施过程咨询讨论时,多次遇到项目组参与单位的科研数据与企业数据融合的难题。有的项目在指南设计时,有示范应用的任务安排和考核指标要求,如软件设计是一家科研机构A完成的,需要到参与单位中的另一家企业B进行测试,需要应用企业B的实际数据时,可能因必须满足企业B的信息系统安全管理要求而无法实施,从而影响了示范应用的实际效果,科学数据要素化活动也受到限制。
影响数据要素收益的原因是多方面的,如在“十三五”国家重点研发计划项目的牵头承担单位中,科研院所和高校所占比例较高,企业牵头承担的项目占比较小。国家重点研发计划重点专项在实施方案设计时,对重点任务布局中的应用示范所占比例也有相应规定。作为国家科学数据来源主渠道的国家重点研发计划,有很多科研工作是在科研实验室里完成的,实验室数据在国家科学数据占比很大。科研实验室数据来源和特征极为复杂,与生产实践的产业数据相比,两者的目的、对象到最终的成果产出,和涉及的质量检验系统,都存在较大差异。科学数据要素的大量不确定性贯穿于研究对象、试验系统、实验原理、测量系统、以及实验环境等。笔者对“十三五”重点研发计划专项6000多个项目考核指标30多种成果分析发现,对论文、专利和科技报告等确定性指标关注较多,而对数据库、示范应用、云平台等弹性较大的考核指标,较难实时评判优劣,对科学数据质量考核还不全面,事前、事中和事后发现科学数据缺陷的评估评价手段不多。科学数据充满了不确定性,大量科学数据要素无法直接规模化应用于生产实践。因为在规模化生产中,数据要素产业化推广应用是以效益为导向。我国正在推进内外贸产品同线同标同质产品认定方式,鼓励各方采信“三同”认证结果,加强“三同”企业和产品信息推介。这需要协同挖掘科学数据要素价值,加强推进中试数字化,推动试制阶段的新产品转化到生产过程的过渡性试验,推动利益相关方共享科学数据、中试数据和产业数据资源。未来如何让更多企业参与科学数据要素制备过程,更好地保障科学数据质量,需要在重点研发计划顶层设计中着重研究,并构建科学数据与产业数据融合发展的成本分摊和利益分享机制。
2014年至今,国家重点研发计划只经历了第一个完整的运行周期,科学数据要素化还有些深层次瓶颈还没有显现出来。在未来,要从最紧迫的事情抓起,小切口、大纵深,更多地关注科学数据制备过程,把项目实施过程关心的实际问题作为突破口,及时了解项目实施过程中的困难诉求,及时切实帮助解决实际问题。扎实做好新时期国家科学数据重点工作,坚持系统观念,注重数据要素系统集成,优化国家科学数据汇交的事前事中事后资源配置,统筹安排强链补链延链提链,大幅提升科学数据要素体系化能力,助推国家创新体系整体效能提升。
国家科学数据要素化发展面临的政策机制风险、激励机制不足风险、科学数据价值创造与利益共享机制不健全、数据要素采集加工的持续性与项目经费供给的阶段性矛盾等,我们应统筹考虑科学数据、产业数据、消费数据和行政数据等多要素融合发展,要从国家数据政策体系创新、地方数字经济协同发展、数据要素经费优化配置、打造科学要素化灯塔项目等角度来探索创新。
(一)不断完善国家科学数据要素高质量流动政策体系
目前我国“科学数据”和“数据要素”政策在整个国家政策体系中占比很小,还没有形成各领域的政策合力,科学数据要素化的政策支撑力度不够。要加快构建新时期科学数据要素化制度政策体系,使之成为社会主义市场经济条件下关键核心技术攻关新型举国体制的重要组成部分。在未来较长一段时期,国家科技计划项目仍将是国家科学数据产生的主渠道。科学数据要素要融入全要素参与收入分配机制,激发劳动、知识、技术、管理、资本和数据等生产要素活力,科学数据政策要与其他领域政策协同发展,形成促进国家科学数据要素流动政策体系。2023年底,为了发挥数据要素乘数效应,国家数据局会同中央网信办、科技部、工业和信息化部等17部门联合印发《“数据要素×”三年行动计划(2024—2026年)》,提出“以科学数据支撑技术创新,聚焦生物育种、新材料创制、药物研发等领域,以数智融合加速技术创新和产业升级。”国家科技计划宜大力支持创新生产要素配置方式,科技专项经费鼓励科学数据要素向这些重点领域流动,及时将数据要素应用到这些产业链上,保证产业体系自主可控和安全可靠。2024年,国家知识产权局、科技部、财政部、自然科学基金委等《关于印发建立财政资助科研项目形成专利的声明制度实施方案的通知》(国知发运字〔2024〕3号),要求财政资助科研项目承担单位或个人在财政科研项目专利申请时,履行声明责任。这有利于推动项目承担/参与单位在国家科学数据产生过程中,关注并妥善解决质量控制激励机制不足的问题。要优先保障国家战略科技力量产出高质量科学数据,支持在保障信息安全的前提下,提升具有先发优势的关键技术和引领未来发展的基础前沿科学数据共享服务水平。
(二)推动科学数据要素融入地区数字经济政策体系
地方政府的数据要素政策是促进数字经济发展的重要推动力。科学数据要素安全高质量流动,对推动地方数字经济健康发展十分重要。据对地方政策体系量化分析,目前科学数据要素化在大多数地方数字经济政策占比较低,使数字经济高质量和健康发展存在隐患,也使区域新质生产力发展缺少战略支撑。受诸多因素影响,区域层面和国家层面的科学数据共享服务模式和机制还没有形成,科学数据资源服务数字经济发展的潜力还没有发挥出来。要探索国家和地方的科学数据要素化激励机制,促进“十三五”“十四五”已有的数千亿元国家科学数据资源与数万亿元级地方科技计划项目科学数据要素,进行存量盘活,增量优化。充分发挥发达省市区的独特优势,率先探索形成科学数据服务地方数字经济发展,打造数字经济标杆城市的资源优化配置模式、路径和最佳实践案例。我国承担国家重点研发计划项目科学数据汇交工作的国家科学数据中心集中在北京地区,而北京市属单位和部门的科学数据资源也很丰富,是北京高质量发展数字经济、建设全球数字经济标杆城市的重要资源。北京数字经济政策体系在不断创新完善过程中,围绕“着力促进数字赋能城市、产业、生活,加快打造全球数字经济标杆城市”的目标,促进数字经济和实体经济深度融合,打造更具优势的数字产业集群,提出了一系列与数据要素相关的政策措施。要推动国家科学数据要素率先融入北京、长三角和大湾区等发达地区数字经济政策体系,遴选科学数据要素与产业数据融合的解决方案和典型案例,形成可复制可推广的先进经验。
(三)鼓励课题净结余资金优先支持科学数据要素流动
要推动结题审计指引助力科学数据要素流动。“十三五”重点专项重点项目在立项评审过程中,由于各种原因,忽视了科学数据要素流动需要的项目专项支持。目前大部分“十三五”重点项目都已经完成了项目综合绩效评价,但这并不意味项目制备的科学数据要素流动结束了。项目科学数据汇交后,要在保障信息安全的前提下,实现更大范围和更高层次的数据要素流动。“十三五”数以千计的国家重点研发计划项目已经进行了综合绩效评价,并经过数据汇交程序进入了20个国家科学数据中心,经过1~5年的保护期,它们就要开始提供科学数据共享服务。“十四五”《国家重点研发计划重点专项概算编制指南》和《中央财政科技计划项目(课题)结题审计指引》(2022版)对科学数据要素的关注不够,因此,“十四五”国家重点研发计划项目实施中,有可能重复“十三五”期间科学数据经费不足的困境。需要《中央财政科技计划项目(课题)结题审计指引》(2022版)在实践中,鼓励科学数据要素化活动。目前科学数据要素化成本分摊与课题净结余资金关系松散,项目执行期结束后的科学数据要素化推广支持乏力。科研经费管理新政策变化对科学数据要素化影响很大。根据《科技部办公厅关于进一步完善国家重点研发计划项目综合绩效评价财务管理的通知》(国科办资[2021]137号)文件精神,在项目综合绩效评价环节,取消评前审查和“课题资金评议得分为80分及以下的,收回结余资金”的规定。现在对国家重点研发计划项目的综合绩效评价均按照该文件精神执行。根据这个文件规定,在项目通过了综合绩效评价之后,项目管理机构不收回净结余资金,净结余的专项经费留在项目承担/参与单位继续使用。如果这类净结余资金能优先分配给项目组成员后续支出,并明确鼓励用于科学数据要素化,则有利于推进科技成果转化。目前还没有科技政策明确规定课题净结余资金应支持国家科学数据要素化。在以后的科技经费政策创新中,建议这类资金优先用于支持国家科学数据要素化发展。
(四)打造科技计划灯塔项目激励科学数据要素化发展
国家科学数据要素化是一个长期持续的过程,要在与实体经济数据不断融合发展中,实现报酬递增,提升科学数据要素价值链。一个国家重点研发计划项目在实施执行期完成了任务书规定的技术任务和执行了经费预算,并由项目管理专业机构组织的项目综合绩效评价专家组评审,获得相关结论(通过、结题或未通过)之后,除极少数项目有可能会参加“回头看”监督检查之外,绝大部分的项目就算是走完了一个完整的周期。其中有15%的项目可能会获得“优秀”等级的评审结论。这对项目承担单位、项目推荐单位和项目组都是很有价值的荣誉。项目承担/参与单位通常以此为荣,并在网络上发布荣获“优秀”等级的项目相关信息。项目组获得持续资助的可能性也增加。从“十三五”6000多个项目综合绩效评价的实践来看,项目科学数据汇交质量对项目是否能获得“优秀”等级评审结论的影响权重很小。在“十三五”制度建设的探索期,国家科学数据中心也还没有对科学数据要素“优秀”项目评价作出制度安排。这需要我们在“十四五”数据汇交工作中引起重视,并在国家科学数据“十五五”规划工作中作出适当安排。《中共中央关于进一步全面深化改革、推进中国式现代化的决定》提出,健全促进实体经济和数字经济深度融合制度。相关数据统计,截至目前,我国累计建成“灯塔工厂”62家,培育国家级智能制造示范工厂421家,智能制造装备产业规模突破3.2万亿。财政部、工业和信息化部联合印发《关于开展中小企业数字化转型城市试点工作的通知》分批组织开展中小企业数字化转型城市试点工作。要打造一批数字化转型“小灯塔”企业,培育一批优质的数字化服务商,开发集成一批“小快轻准”的数字化解决方案和产品。目前中小企业数字化转型中还存在很多“不愿转、不敢转、不会转”的痛点难点。其中一个关键堵点是中小企业获得国家科学数据要素支持的渠道还有待拓宽增速。数实融合深入发展,科技成果加快转化应用,离不开国家科学数据要素化的强有力支撑。经过多年发展,国家科学数据中心已掌握了丰富的科学数据要素资源,打造国家科学数据要素化灯塔项目,激励科学数据、产业数据和社会数据融合发展,促进新时期中国数据要素体系化高质量发展,已具备基本条件。借鉴我们做“十三五”国家重点研发计划67个专项6000多个重点项目综合评估的经验,每个重点专项推荐一两个代表性项目。在已立项的一万多个重点项目中,若能百里挑一,平均每一个重点专项部署1个灯塔项目,就可精心培育100个国家科学数据要素化“灯塔”项目。在未来充分发挥灯塔项目、领航团队的头雁作用,将国家科学数据要素强链补链延链提链做好,激励更多科学数据要素化,更多更快更地打造“数字工厂”“灯塔工厂”“未来工厂”,以数字化绿色化为方向,支撑现代产业体系升级,进一步提升国际分工地位,推动我国产业迈向全球价值链中高端。
【作者简介】申其辉(1966-),高级经济师,研究方向:科学数据、质量基础设施。国家科技部重点研发计划“国家质量基础的共性技术研究与应用”专项的总体组专家;多个专项的财务评审专家;科技项目数据汇交的培训主讲专家;全国科技平台标准化技术委员会(TC486)科学数据组专家。通信邮箱:shenqihui@126.com。
【基金名称】《计量科学数据高质量共享服务与品牌推广》(APT2201-20),该项目属2022年度国家科技基础条件平台重点项目“国家计量基标准体系资源共享平台”项目计划。
[1] 徐波、王瑞丹、王卷乐,等.科技计划项目科学数据汇交共性机制研究[J].中国科技资源导刊. 2021,53(01):9-14.
[2] 徐墨庚、姜晓轶、童心,等.基于区块链的科学数据汇交存证模型研究与实现[J].海洋信息技术与应用. 2023,38(04):238-248.
[3] 王雪艳、井艳玲、赵爱芳.基础医学科学数据汇交管理及数据特征[J].基础医学与临床.2022,42(05):852-856.
[4] 陶毅、苏爽、赵正宜,等.基于元数据的计量科学数据汇交系统研究[J].中国科技资源导刊.2022,54(02):1-12,92.
[5] 陈军、李大博、杨智君,等.计量科学领域科技项目数据汇交管理研究[J].中国科技资源导刊. 2021,53(04):83-89.
[6] 白燕、杨雅萍、王祎.科技基础性工作专项资源环境领域项目数据汇交进展与分析[J] .中国科技资源导刊. 2020,52(05):52-62.
[7] 林海、王卷乐.国家重点基础研究发展计划(973)资源环境领域项目数据汇交工作正式启动[J].地球科学进展. 2008,23(08):895-896.
[8] 肖旭伏、仪彦.基于价值链视角的科学数据流通与利用研究[J].中国科技资源导刊. 2024,56(03):48-54,81.
[9] 王漪、康林冲、姜晓轶,等.海洋科学数据流通与交易推进思路[J].海洋信息技术与应用. 2023,38(04):193-199.
[10] 杨雪梅.数据要素市场化背景下高校图书馆科学数据开放共享研究[J].图书馆学刊. 2023(01):26-31.
[11]杨成、申其辉.认证认可促进科学数据与产业数据融合发展的作用[J],中国计量. 2023(12):59-63.
[12]郭华东.把握“保护-利用”动态平衡,推进科学数据高质量发展[J].农业大数据学报, 2024, 6(2):145.
[13]廖方宇,李婧,龙春,等.开放科学背景下科学数据开放共享安全挑战及我国对策思考[J].农业大数据学报, 2024, 6(2):146-155.
[14]杨渝,王炜,陈世武.数据隐私保护关键词检索技术研究综述与应用分析[J]. 农业大数据学报, 2024, 6(2):185-204.
[15]魏鑫,孔丽华,汪洋.我国科学数据出境管理对策研究[J]. 农业大数据学报, 2024, 6(2):156-160.
[16]李宜展,董璐,王东瑶,等.国际科技组织与国际科技合作计划中的科学数据安全治理[J].农业大数据学报, 2024, 6(2):161-169.
[17]王佳荣,周彩秋,苑新阳,等.国家高能物理科学数据安全保障体系[J]. 农业大数据学报, 2024, 6(2):185-204.
[18]戴力新、戴琦(2023).我国科学数据中心建设现状及其运行机制研究[J].中国科技资源导刊. 2023, 55(05):1-10.
[19]张胜发、马玉环、张敬晨,等.基于数据安全的健康医疗科学数据分级指南研究[J].医学信息学杂志. 2023, 44(08):19-24.
[20]支凤稳、赵宇晨.我国科技计划项目科学数据汇交政策分析[J].图书馆学研究. 2021(23):45-52.
[21]阮冰颖、刘桂锋、刘琼.科研人员视角下科学数据安全影响因素仿真分析[J].情报理论与实践. 2022, 45(02):137-145.
[22]刘桂锋、马昕玥、刘琼.科学数据资产管理框架构建及实现路径研究[J],中国科技资源导刊. 2023, 55(06):11-21.
[23]苏靖.大数据时代加强科学数据管理的思考与对策[J].中国软科学 . 2022(09):50-54.
[24]石蕾、高孟绪、徐波、王瑞丹.欧美建设发展科学数据中心的经验及对我国的启示[J].中国科技资源导刊.2022, 54(03):31-36+110.
[25]王瑞丹等.复杂场景下科学数据中心运行状况评价模型研究[J].中国科技资源导刊. 2022, 54(02):27-34,64.
[26]王芳、卜昊昊.科学数据管理政策发展比较研究[J].中国图书馆学报 . 2022, 48(06):77-96.
[27]徐淋楠、段美珍、寇晶晶.开放共享环境下科学数据安全治理路径[J].中华医学图书情报杂志. 2022, 31(06):1-8.
[28]姜鑫、王德庄.利益相关者视域下科学数据开放政策协同研究——基于NVivo12的质性文本分析[J].情报理论与实践.2022, 45(12):92-102.
[29]阳巧英、夏义堃.我国科学数据政策结构特征与演进逻辑分析(2001—2022年)[J],情报资料工作.2023, 44(06):6-14.
[30]丁晓芹、汤怡洁、徐雯.我国科学数据汇交管理现状及面临的问题[J],科技管理研究.2023, 43(23):63-69.