摘要:
公共数据利用是激发数据要素价值化,推动数据产业发展的重要方面,它不仅是数据公共属性的要求,更是数据人身属性的要求。本文梳理了公共数据利用的三种形式,在传统的数据共享、开放基础上,公共数据的开发利用通过授权、运营和开发开放,极大拓展了公共数据开放利用的范围。依托数据基础设施,借助数据产品开发而实现的开发开放,使得只要能在公共部门之间共享的数据(不管是无条件还是有条件)原则上都可以为社会开发利用,共享范围即开放利用范围,能共享就能开放利用。
关键词:公共数据;数据开放;数据开发利用;授权运营;开发开放
2024年政府工作报告指出,“健全数据基础制度,大力推动数据开发开放和流通使用。”这是首次创新提出“开发开放”,切中了数据要素的本质,即可以通过面向应用场景的数据产品的开发实现更大范围的数据开放。
一、公共数据利用的传统形式
一般将公共数据为其他数据处理者利用的形式分为三类,即共享、开放和开发利用,有人也将后者称为授权运营。
共享一词的广义用法泛指任何数据处理者之间的数据共享。这当然是一个趋向却又难以达到的目标。但是限制一定范围和边界的话,数据共享还是被广泛推进。例如欧盟的共同数据空间,通过自主加入的联盟形式在数据空间内实现数据共享。我国目前也在积极探索行业数据空间等数据空间内的共享形式。不过,限定范围的数据共享在国内主要指公共数据共享,这是共享一词的狭义用法,指的是数据在公共机构之间的共享。本文在狭义上使用共享一词。
广义的数据开放指任何数据处理者对外的数据开放,特别是公共机构、互联网平台等数据大户。本文使用狭义的数据开放概念,专指公共机构对社会的数据开放。
数据开发利用指的是将数据开发成为针对特定应用场景的特定数据产品后通过服务输出加以利用的形式。本文中特指公共数据的开发利用。这可以是数据处理者直接使用公共数据进行开发利用,也可以是通过授权运营平台对公共数据加以开发利用。因此,授权运营只是公共数据开发利用的形式之一,尽管是最主要的形式。
(一)公共数据共享、开放
公共数据共享、开放是有边界的。当前,公共机构持有的数据一般分类(也是分级)为:按共享类型分为无条件共享、有条件共享、不予共享等三种类型;按开放类型分为无条件开放、有条件开放、不予开放三种类型。一般说来,无条件开放是无条件共享的子集;不予共享是不予开放的子集。实务中,可开放数据远远少于可共享数据。(见表一)
公共数据应当以共享为原则,以开放为原则。不予共享、不予开放需要有法律法规依据,并纳入负面清单管理。负面清单之外的数据均需共享、开放。
表一:公共数据分类分级
《国务院关于印发促进大数据发展行动纲要的通知》要求:大力推动政府信息系统和公共数据互联开放共享。[1]针对公共数据中最主要的部分即政务数据,《国务院关于印发政务信息资源共享管理暂行办法的通知》第五条明确:政务信息资源共享应遵循“以共享为原则,不共享为例外”,各政务部门形成的政务信息资源原则上应予共享,涉及国家秘密和安全的,按相关法律法规执行。第十条规定:凡列入不予共享类的政务信息资源,必须有法律、行政法规或党中央、国务院政策依据。[2]
实务中,真正能够无条件共享、开放的数据是少数,绝大多数数据是有条件共享、开放,还有甚至是不予共享、开放。对于不予共享、开放,因为有清晰的要求,即必须有法律、行政法规或党中央、国务院政策依据,相对而言不难梳理,并纳入负面清单,这类数据应是极小部分。但是对于有条件共享、开放的“条件”没有明确规定,没有明确依据,也没有一定的标准,又需要数源单位审核,结果基本是政务部门自由裁量,导致数据共享、开放成效大打折扣。政务部门对于有条件共享、开放数据的提供也存在疑虑,不同工作人员理解不一,多层审核,繁琐复杂,一环不通,就无法下一步,以致久拖不决,成为数据共享、开放中的常态。
(二)公共数据开发利用
公共数据开发利用最主要的形式是授权运营,即由专门的运营机构受托对公共数据进行运营。运营机构要让公众、企业能够利用公共数据,绕不开还是要解决公共数据对外开放问题,只是可以不再只是简单粗暴地对外普遍开放,而可以精细化地对公共数据进行开发,通过“数据不出域”“可用不可见”等形式对外提供数据服务。为此,运营机构需要对公共数据进行归集、编目、治理、脱敏等处理,并且需要建设数据基础设施,以便落实“数据不出域”“可用不可见”等要求。但是,还是绕不开数源单位(公共部门)原始数据的“转移”问题,即绕不开有条件共享、开放数据的“条件”审核问题。
问题的关键在于,需要厘清公共部门对于“条件”的审核,“条件”是什么,审核内容是什么,审核形式是什么。说清楚这些,才能避免自由裁量权和久拖不决,实践中才能破解共享难、开放难、开发利用难的问题。
二、公共数据利用的新要求
(一)数据流动的法律要求
《个人信息保护法》[3]第四十四条规定:个人对其个人信息的处理享有知情权、决定权,有权限制或者拒绝他人对其个人信息进行处理。第四十五条规定:个人请求将个人信息转移至其指定的个人信息处理者,符合国家网信部门规定条件的,个人信息处理者应当提供转移的途径。
关于个人信息“转移”的要求,即在个人决定权之下,个人信息处理者“应当提供转移的途径”。这意味着,数据共享、开放不仅是数据公共属性的要求,而且首先是数据人身属性的要求,个人有权要求数据按照其意志进行共享、开放。这不仅是对于公共部门,而是包括所有个人信息处理者,数据的人身属性都要求数据能够“转移”或者说“流动”。这是个人“决定权”的要求,这不是个人信息处理者所能左右的,不管这个个人信息处理者是公共机构、行业企业、互联网平台企业或是其他什么主体。
这实际上就相当于欧盟所规定的个人数据的“可携带权”。
从法理上看,《个人信息保护法》的原则同样适用于法人数据:法人对其法人信息的处理享有知情权、决定权,同样拥有“可携带权”。也就是说,《个人信息保护法》关于信息处理决定权的原则,适用范围可以扩大到涉私数据(包括个人数据和法人/组织数据),由数据关联对象行使决定权。这样,法人数据的“转移”或者说“流动”也是由数据关联对象(法人)决定的。
(二)有条件共享、开放数据的条件“秒审”机制
除了数据涉及国家安全或公共利益,这样的数据会被纳入核心数据或重点数据而依法依规不予共享、开放,所谓有条件共享、开放的“条件”,基本上就是涉及个人隐私或法人/组织商业秘密。对于这种情况,究竟是让公共机构行使对“条件”的审核权还是让数据关联对象行使对数据转移(包括数据共享和开放)的决定权呢?
数据具有主权属性、人身属性、公共属性和价值属性等四大属性,其位阶等级顺序是:主权属性>人身属性>公共属性>价值属性。这从根本上规定了数据要素的特性。[4-7]
数据关联对象(数据来源者)的决定权高于数据处理者的相关权利。数据共享、开放意味着数据从一个数据处理者转移到其他数据处理者,数据共享、开放发生在数据“转移”环节,其决定权在数据关联对象,而不是数据处理者。当然,共享、开放的范围、条件也应当是由关联对象决定的。因此在数据共享、开放上,我们需要落实关联对象的自决权。
当然,公共数据由公共机构持有,公共机构在行使数据持有权时也负有责任。《个人信息保护法》第五十一条规定,个人信息处理者应当……对个人信息实行分类管理。如何把握分类的边界?应根据信息的处理目的、处理方式、信息的种类以及对关联对象权益的影响、可能存在的安全风险等因素综合界定,如什么数据可以共享、开放,什么条件下共享、开放。该过程中公共部门负有审核责任,即行使对数据分类管理的审核权,而非对数据处理的决定权。审核权要服务于决定权。
文献[8]指出:公共机构对数据共享、开放的审核主要在审核内容和审核形式两方面。
审核内容方面:一是合法性审核。明确不予共享、开放的范围。主要是涉及数据主权属性。二是安全性审核。主要是对“条件”的审核,明确共享、开放的条件。无条件是原则,有条件需要说明。大多数条件体现为涉及私权,即涉及数据人身属性。最重要的是,明确共享、开放是原则要求,将数据在最终使用环节的安全把控交给关联对象。
审核形式方面:一是一揽子审核。因为有数据关联对象的最终把关,并且是一次使用一次授权,因此无需公共部门越俎代庖,也就是说,形式审核不必每次必审,而是应当一揽子审核、批量审核,对于相似的使用场景、使用主体,进行一揽子、批量、一致性审核。二是自动化审核。数据共享的条件应当尽量结构化、指标化,使得条件审核可以机器自动判别进行,可以预先写进智能合约,符合条件设定的标准即自动触发审核通过。
以上就是海南公共数据共享、开放和开发利用中所实践的“秒审”机制。
借助“秒审”机制,一方面可以破解传统的公共数据共享、开放中的“条件”不透明和自由裁量问题,极大提高共享、开放效率,实现公共数据的实时共享、开放。另一方面也可以解决公共数据授权运营中运营机构同样受制于“条件”自由裁量的问题,从而使得运营机构可以对数据进行实时性的利用,以“可用不可见”的形式实时输出服务结果。
海南省积极推进公共数据“秒审”工作,将数据共享开放条件“秒审”率纳入日常通报考评机制,用以衡量有条件共享开放数据供给的及时性,“秒审”率得到快速提高。
(三)公共数据授权运营和开发开放
公共数据为社会所利用实际上有两种形式,其一是对不涉及国家安全、公共利益和个人隐私、法人/组织商业秘密的数据的普遍开放;其二是按照“以开放为原则”的要求,对涉及国家安全和公共利益而纳入了负面清单的数据之外的数据,落实开放要求。但是鉴于这些数据可能和个人隐私、法人/组织商业秘密相关,需要关联对象(个人、法人/组织)进行授权方能开放和利用,即需要以“数据不出域”“可用不可见”等形式在数据主体(关联对象)授权下开发利用。后面这种数据利用是一种开发开放的形式。
回顾本文一开始的分类,我们再梳理一下:公共数据利用包括共享、开放和开发利用(含授权运营)三种形式。我们将后面两种,即开放和开发利用,称为开放利用,也就是这里说的,开放利用包括了普遍开放和开发开放两种形式。在第三种,即开发利用中,进一步细分则是包括了自主开发利用和授权开发利用两种形式,其中自主开发利用无需进一步讨论,自主开发开放即可,我们重点研究的是授权开发利用形式。
表二:公共数据利用分类
尽管业界已经约定俗成将公共数据利用分成了共享、开放和授权运营三类,但我们还是宁愿使用共享、开放和开发利用这样的分类。这是因为更精准地说,授权运营只是授权开发利用中的部分层面。我们将授权开发利用(不考虑自主开发利用)分为授权、运营和开发开放三大层面。(见表二)授权的主体是公共机构,特别是公共数据管理机构,授权的对象是受托运营机构。运营的主体是受托运营机构,运营对象是公共数据及其他数据,需要建设完善数据基础设施并运营数据开发利用平台。开发开放的主体是依托数据基础设施和平台进行数据产品开发的数据产品开发者等,开发开放的服务对象才是公共数据开发利用的最终目标,即公众和市场主体等。
因此就公共数据开发利用的最终目标而言,授权、运营、开发开放是环环相扣、缺一不可的。授权、运营是为了使得开发开放能够最终服务公众和市场主体等;开发开放又必须依托授权运营的数据基础设施和平台才能进行数据产品的开发生产、输出服务以及流通交易。
对于公共数据授权运营和开发开放,需要建设完善一整套数据基础设施和运营平台。
三、公共数据开放利用范围的拓展
(一)以数据基础设施支撑公共数据开发开放
公共数据的开发开放需要破解两方面问题:一是解决公共数据如何在“数据不出域”的前提下能够让社会公众和市场主体通过“可用不可见”等形式利用起来;二是解决有条件共享、开放数据的“条件”审核问题,能够实现一揽子审核和自动化审核,达到“秒审”的要求。
解决这两方面问题,一是需要依托获得授权的运营平台;二是需要依托一整套完整的数据基础设施,尤其是其中的元数据基础设施和公共化基础设施。[5]
元数据基础设施解决公共数据“找得到”和“看得懂”的问题,数据公共化基础设施的核心则是解决数据如何从私有域走向公共域,破解“数据不出域”的矛盾,让公共数据“供得出”“流得动”。同时,两者的结合还要解决有条件共享、开放数据(基本上等同于涉私数据)的“秒审”问题,即通过将有条件共享、开放数据(涉私数据)的审核交给关联对象自身来行使决定权的方式实现。
在海南的探索实践中,数据管理机构按照政府文件(未来国家将会在探索实践基础上出台相关法规规范)要求通过招标方式产生运营机构,并进行了相关授权,由中标的运营机构建设运营海南“数据产品超市”,在政府大数据平台基础上建设了以可信数据空间为核心的数据公共化基础设施和相关运营平台。
通过依托电子政务外网和政府大数据平台形成扩大的安全域,打造可信数据空间,形成数据公共化基础设施,可以实现在“数据不出域”的前提下,数据产品开发者基于这套基础设施,开发数据产品,并在数据产品中嵌入数据关联对象的授权通道,在数据产品的具体使用场景中,由关联对象行使决定权,对相关数据处理和使用进行授权,借助于公共数据的“秒审”机制,公共数据得以瞬间集成到数据产品中,形成数据服务输出给使用者。这就是公共数据通过开发开放实现的开发利用。[5,9,10]
(二)拓展公共数据开发开放到共享的最大范围
公共数据开发开放的实现可以极大拓展公共数据开放范围。通过落实授权、运营和开发开放,落实关联对象对有条件共享、开放数据(涉私数据)的决定权,实际上我们已经将可共享、可开放的数据(不管是无条件还是有条件)都纳入了可开发利用的数据范围。也就是说,只要能在公共部门之间共享的数据(不管是无条件还是有条件)原则上都可以为社会开发利用。因此,我们可以说,共享范围即开放利用范围,能共享就能开放利用(包括普遍开放和开发开放)。(见表三)
表三:通过开发开放扩大公共数据开放范围
表二可见,公共数据开放利用包括了开放和开发利用。开发利用包括自主开发利用(自主开发开放)和授权开发利用(授权、运营和开发开放)。因此,就开放形式而言,表三可见,公共数据开放利用包括了无条件开放、有条件开放和开发开放。我们将无条件开放、有条件开放合称为普遍开放。需要指出,有条件开放将极大压缩,除了个别特殊情形,这部分数据或者转变为无条件开放,或者转变为开发开放。因此,除非特别指明,公共数据开放利用主要就是无条件开放(普遍开放)和开发开放。
(三)发挥公共数据开放更大作用
事实上,社会上对于公共数据开发开放是有所担心的,担心是否会冲击已经有的公共数据普遍开放,从而增加数据开放的成本,增加数据处理者的负担?
公共数据取之于民,用之于民,应当“以开放为原则,不开放为例外”。在公共数据的开放利用中应遵循普惠原则,确保数据能更广泛地应用于经济社会生活中,培育和壮大数据产品开发者,让市场主体繁荣发展。
对政务数据而言,无条件开放数据应当免费面向社会开放。不仅如此,政务部门无论作为数据采集者,还是作为公共数据产品的服务提供者,都应对外提供无偿服务。
对于运营机构,大量原始数据需要经过清洗加工、存储管理、脱密脱敏等环节,才能转化成供社会直接使用的高质量数据或数据中间产品,需要在安全可信数据空间等基础设施支撑下才能开发利用,过程需要投入一定成本。因此基于所提供的增值开发服务,运营机构享有相应的收益权,这是合理的。对于参与开发开放的数据产品开发者等市场主体,作为数据开发开放的真正激活者,由市场评价贡献、按贡献决定报酬,应是数据价值权益的核心贡献者和首要激励对象,理应获得相应收益。
可见,公共数据开发开放存在一定的成本是合理的。但确实不应冲击无条件开放。
1.扩大无条件开放的比例
为了发挥公共数据开放利用更大价值,整体节约社会利用公共数据的成本,我们认为,在开放利用的结构中,应逐步扩大无条件开放的比例。这是因为,开发开放虽然极大拓展了数据开放利用范围,毕竟是针对特定场景应用的专门开发,综合成本相对较高;而无条件开放方式,让社会公众和市场主体能够直接下载或调用相关数据,是更为普遍和低成本的开放方式。
这方面公共数据管理部门和公共财政可以主动作为。可以让运营机构通过梳理共性数据需求,主动进行公共数据治理,对涉私数据进行匿名化处理后形成数据中间产品(数据集等),增加对社会无条件开放。
2.赋能关联对象“数字空间”
要更好地推动公共数据开发开放,需要让关联对象对数据产品使用授权更加便利化,需要落实关联对象的数据“可携带权”。这需要通过关联对象“数字空间”来实现。因此,公共数据开放利用首先需要落实的就应该是对关联对象(数据主体)的开放。这是一种定向开放,即涉及到数据主体的全部数据都对数据主体本身开放,逻辑集成到数据主体的“数字空间”,落实数据主体对数据的“可携带权”,使得数据主体(关联对象)可以随时随地查阅自身数据,并随时随地可以行使决定权。[6]
依托关联对象“数字空间”,使得数据产品开发和使用极为便利,通过嵌入在数据产品中的授权“码”,关联对象可以便利地行使数据决定权,从而极大助力公共数据的开发开放。
注释:本文数据、信息两词通用。数据(侧重形式)和信息(侧重内容)相统一,可以通用。
参考文献:
作者简介:董学耕,海南省大数据管理局原局长、高级工程师,研究方向:数字政府、数字经济、数据要素。
责编 | 符丹丹
编辑 | 蔡青松
转载请注明来源 | 海南省大数据管理局
REVIE
董学耕 | 两个信息之辩正(十五)