张健华:公共数据的开放模式与价值实现

学术   财经   2024-11-20 11:30   北京  

文 / 清华大学五道口金融学院金融发展与监管科技研究中心主任 张健华

清华大学五道口金融学院博士生    陶一凡

随着数字经济与数字金融的发展,数据要素尤其是占比较高的公共数据资源的价值越来越受到重视。本文研究公共数据的价值、开发模式,以及不同模式下的价值实现差异。结果显示,公共数据除了有财政价值之外,还有整体经济社会价值,并且在两种开放模式——开放平台和授权运营下,有较大的不同。开放平台模式大多为无偿使用,使用门槛较低,能打破区域内的信息壁垒,促进整体经济协调发展。授权运营模式能面向特定企业的需求调整其提供的数据产品,更具有专业性和激励性,更好服务目标企业的创新行为。


清华大学五道口金融学院

金融发展与监管科技研究中心主任  张健华



公共数据的价值


公共数据的经济价值尤其是在公共财政收入中体现的价值已经得到了充分关注。一方面,公共数据的潜在收入与市场规模较大,目前各种测算结果均表明公共数据带来的收入至少为万亿元级别。另一方面,长沙等各地的公共数据运营文件中明确将公共数据与收益、财政等相挂钩,各界从不同角度均在探索公共数据在各类财政模式上的可行性。


然而,公共数据带来的价值不仅仅是简单的财政价值,其对整体经济社会发展产生的价值更为重要。公共数据开放后最直接的使用者和受益者就是与该数据相关的企业。企业可以利用公共数据得到关于消费者、监管者、竞争者的特定信息,提高资源配置的效率,提升全要素生产率。公共数据作为数据要素的一种,自然也可用于推动范式创新,扩展生产可能性边界,由此推动企业的数字产业化进程,促进企业创新。公共数据开放除了对现存的特定企业有巨大的创新价值外,还对地区内的潜在进入者和其他行为主体有重要的价值,促进整体经济循环的畅通。潜在进入者可以利用公共数据降低制度性交易成本,激发起内在的创新活力。公共数据开放还可以降低该地的审计成本和城投债的发行成本。公共数据开放破除了区域内各类壁垒,促进区域内的协调发展。通过上述渠道,公共数据促进了当地经济的高质量发展,进而可以扩大税基,间接产生公共数据用于财政收入的价值。


公共数据在价值实现的过程中都需要公共数据开放通道提供足够的质量保障和技术支持,所以公共数据的开放模式在公共数据的价值实现中起到了重要的作用。



公共数据的开放模式


《中华人民共和国国民经济和社会发展第十四个五年规划和二○三五年远景目标纲要》中指出,“探索将公共数据服务纳入公共服务体系,构建统一的国家公共数据开放平台和开发利用端口”“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用”。《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》中指出,“推动用于公共治理、公益事业的公共数据有条件无偿使用,探索用于产业发展、行业发展的公共数据有条件有偿使用”。


开放平台指连接公共数据发布端与公众数据获取端的中介与载体,使民众能够便捷地获取易使用、高质量的公共数据。授权运营指将公共数据的“加工使用权”或“产品经营权”授予依法确定的运营机构,加工形成公共数据产品后并进行市场化经营,向社会提供服务。公共数据开放平台一般只有数据的持有权和使用权。公共数据开放平台供给的一般以无条件开放数据为主,并大多数可无差别下载或API调用,部分开放平台中也存在有条件开放数据,但如何申请开放的流程较为不透明。公共数据授权运营主体则完整的拥有数据三权——持有权、使用权和经营权,其供给的一般是加工后的数据产品而不是原始数据,并通过数据沙箱、隐私计算等技术手段来实现数据的可用不可见。


根据《2023中国地方公共数据开放利用报告(城市)》《中国政府开放数据利用研究报告2022》以及其他平台公开资料,截至2023年,已经上线公共数据开放平台的城市高达204个,已经覆盖了全国的绝大部分地区。根据北大法宝数据库,截至2023年,地方政府文件中提及“公共数据授权运营”的城市共80个,而2021年仅有21个,尝试开展公共数据授权运营的城市数量高速增长。2023年,同时有公共数据授权运营政策文件和已上线的公共数据开放平台的城市共有60个,比2022年数量增长了42.86%,两种开放模式并存即将成为城市级别公共数据开放的主流模式。

资料来源 :开放平台模式统计来源于《2023 中国地方公共数据开放利用报告(城市)》《中国政府开放数据利用研究报告 2022》以及其他平台公开资料,授权运营模式统计来源于北大法宝数据库中提及“公共数据授权运营”的地方政府文件

图  公共数据不同开放模式的城市数量


从目前的实践来看,公共数据开放平台依据政府公共数据开放的法定义务开展建设,由行政部门牵头并直接管理。这使得平台上开放的公共数据质量很大程度上取决于数据管理机构的行政职能,数据的清洗和加工都被各个部门共同来完成,以至于公共数据的完整性、一致性、及时性、准确性都难以和市场主体的需求做到很好的衔接。各地公共数据开放平台提供的数据已经通过数据竞赛、开发者中心等形式实现了市场主体数据查询、交通出行一码通行、停车预约错峰共享、医疗保险快速理赔等多个涉及广大民生场景的具体应用,但这些应用的关注度和使用频次还相对有限,需要数据管理机构和各个市场主体进一步配合与推广。


公共数据授权运营在各地的试点过程中形成了多种多样的政企合作模式。北京等地使用的主题专区模式在政府和数据使用企业之间建立多个面向特定市场主体需求的互信平台。专区不仅有公共数据更新运营、共享互联、加工应用的机制,还有通过数据质量检测来促使有关部门工作提升的职责,通过和上下游的定期沟通,有效地解决公共数据供需之间的矛盾。上海等地则依托统一的数据集团,不仅囊括了公共数据、国企数据、行业数据和其他数据的交易流通和开放利用,还参与数据资产定价评估、重要数据产业投资等关联业务。数据集团在负责不同业务的成员企业之间建立统一的数据共享平台,能够解决公共数据与其他数据资源融合协作不足的问题,实现生态化的全方位赋能。除此之外,各地还探索出特许开发、市场供应链等模式,并利用各类专业技术来保障数据的共享、加工、融合与应用,拓展公共数据授权运营的可行性。各地运营主体已经体现出市场化激励下的积极性,实现了面向中小微企业的普惠金融、针对环保排放数据的绿色金融、面向医患用药效果的医药开发、针对实时路况数据的自动驾驶技术等应用场景。然而,目前公共数据授权运营才刚刚起步,权益如何分配、收费如何确定、商业模式能否持续、数据加工价值如何体现等等问题都处于初步探索阶段,还需要进一步的研究。



不同开放模式下的价值实现


公共数据的授权运营模式能直接通过售卖数据产品来直接实现其财政价值,而目前开放平台尚无较好的盈利模式,只能通过扩大税基来间接实现其财政价值。公共数据的经济社会价值虽通过两种模式均可实现,但两种模式有其各自的特殊性。授权运营模式能更好满足市场上特定企业的数据需求,促进企业的创新行为。开放平台模式能被所有区域内的主体所平等利用,减小区域内的发展差异。


解释变量为城市的公共数据开放模式,并分为如下三种情况——有开放平台有授权运营、有开放平台无授权运营、无开放平台有授权运营,依此设置三个虚拟变量,属于则赋值1,不属于则赋值0。对应上述假说,被解释变量共设置四个,分别是财政盈余、经济增长、企业创新与协调发展,财政盈余用地方财政一般预算内收入和地方财政一般预算内支出之差对GDP占比来表示,企业创新用当年授权发明专利数量(单位:千个)来表示,协调发展用城市内不同格点夜间灯光密度的方差来表示,经济增长用城市内夜间灯光密度平均值的增长率来表示。此外,本文还控制了城市层面的控制变量,包括经济水平(平均灯光密度的对数)、产业结构(第二产业对GDP占比和第三产业对GDP占比)、开放水平(外商投资企业数)、消费水平(社会消费品零售总额对GDP占比)、金融水平(年末金融机构各项贷款余额对GDP占比)、教育程度(政府教育支出对GDP占比)等。


本文使用的数据主要有三处来源。一是《中国城市统计年鉴》、NPP-VIIRS夜间灯光面板数据、各地统计年鉴等城市面板数据,用以构建财政盈余、经济增长与协调发展等被解释变量与控制变量。二是2010—2022年的企业专利数据库,用以构建企业创新等被解释变量。三是上文所述的《2023中国地方公共数据开放利用报告(城市)》《中国政府开放数据利用研究报告2022》、其他平台公开资料和北大法宝数据库,用以构建核心解释变量。


为了验证本文的研究假设,构建如下计量回归方程:

其中,i代表城市,t代表时间,Yit表示上述四种被解释变量——财政盈余、企业创新、协调发展与经济增长,Treatit表示上述三个解释变量——开放平台有授权运营、有开放平台无授权运营、无开放平台有授权运营,β衡量了三种模式分别对被解释变量的经济作用,Xit表示上述控制变量,本文还控制了城市固定效应μi、时间固定效应πt,标准误εit聚类到城市维度。本文使用上文中提到的城市面板数据对该公式进行计量回归估计。


结果表明,公共数据开放的三种模式均对当地财政盈余有显著的改善作用,能增加至少1%GDP的财政盈余。其中,无开放平台有授权运营模式的促进作用最大,有开放平台有授权运营模式次之,有开放平台无授权运营模式作用相对较小。该结果符合授权运营模式有直接运营收益的财政价值和间接扩大税基的财政价值,而开放平台只有后者间接价值的经济学分析。公共数据开放的三种模式对地方企业创新也有积极的促进作用,其中有授权经营的促进作用更大,尤其是有开放平台有授权运营模式同时存在促进作用最大,可以增加当地发明专利3000余个。公共数据开放下企业得到公共数据资源后创新活动会更加活跃,而专业化的创新行为需要更加有质量的数据和服务,也就需要专业化的授权运营机构来进行针对性地运作,这就解释了上述计量回归结果。公共数据开放平台对地方协调发展和经济增长有显著的促进作用,无开放平台有授权运营模式对协调发展和经济增长的作用不显著。这是因为开放平台模式使得区域内的每个主体能够无差别、无偿获得各类数据,能够打破不同企业和个人之间的信息壁垒,减少区域内部的发展差距,促进整体经济的总体发展。授权运营模式目前覆盖的企业较少,还不能对整体经济发展产生较大影响。



结论和政策建议


公共数据占全社会数据总量的比例较大,不仅有财政价值,还有整体经济社会价值。公共数据开放目前主要有开放平台、授权运营两种模式,并在全国各个城市逐步推广开来。两种模式虽然都实现了一定的应用场景,但仍然存在开放度不高,使用次数较少等问题。公共数据开放的两种模式对价值实现有不同的效应。授权运营模式不仅对财政盈余的改善作用更加明显,而且通过其专业性对创新性发展的作用更加积极。开放平台模式则通过其普惠性对协调性发展的作用更加积极。


由此,本文提出如下建议:第一,要更大程度地开放公共数据,并在不同部门、不同区域间做到统筹结合,充分发挥公共数据的作用。第二,要提高公共数据的供给质量,做到数据的完整、一致、准确、及时,积极推广并丰富公共数据的应用场景。第三,要对不同的数据类型和应用场景采取不同的开放模式,同时利用开放平台的普惠性和授权运营的专业性。第四,要在兼顾公平和效率的基础上,探索公共数据开放的收费模式与权益分配机制,更好促进数字化转型和高质量发展。


(此文刊发于《金融电子化》2024年10月上半月刊)


推荐阅读(点击图片查看精彩内容)










新媒体中心

主任 / 邝源

编辑 / 姚亮宇  傅甜甜  张珺  邰思琪

金融电子化
面向金融界科技人员、业务人员,在金融信息化建设中,为领导决策提供参考,为科技人员和业务人员提供交流的园地以及了解科技应用的窗口,为读者提供金融信息化发展最前沿的各类知识和信息。
 最新文章