图源 | Internet
高 凡1 徐思佳2 李易衡3
1.西南交通大学公共管理学院,成都,610031;
2.电子科技大学公共管理学院,成都,611731;
3.北京理工大学管理学院,北京,100081
摘要
关键词
数字政府 政府数据开放 区域差异 动态演进
引用格式
高凡,徐思佳,李易衡.政府数据开放水平测度、区域差异分解及动态演进——基于21个省份的面板数据分析[J].信息资源管理学报,2024,14(5):59-74,90.
01
引言
随着科技革命与产业升级转型交汇期的到来,数字经济已成为转变经济增长方式、提高区域竞争力和实现高质量发展的新动能[1]。大数据作为数字经济的重要形式之一,已受到广泛关注,截至目前,中共中央、国务院已发布多项与数据相关的政策文件,2014年首次将大数据纳入政府工作报告、2015年《促进大数据发展的行动纲要》将大数据上升为国家战略、2017年制定《大数据产业规划》、2020年《关于构建更加完善的要素市场化配置体制机制的意见》将大数据列为新型生产要素,以及2021年《“十四五”发展规划》明确提出完善大数据标准体系建设等,可见党中央、国务院高度重视大数据在推动经济社会发展中的地位和作用。为充分发挥大数据的经济与社会价值,各地政府开始逐步推动政府数据开放,但中国是一个地域和人口大国,各地政府数据开放发展状况差异较大,区域发展不平衡问题突出且备受关注[2]。在经济发展逐步倚重数据资源的情形下,政府数据开放的差异状况将会影响到未来地区发展的格局,这也是近年来各地政府争相颁布数据相关政策文件,上线数据开放平台的重要原因。
为了全面掌握政府数据开放差异的真实情况以提出促进政府数据开放均衡的对策,本文着力探讨和明晰以下问题:各地政府数据开放的基本差异情况如何,政府数据开放水平是否存在时空差异以及差异程度如何、差异的来源是什么,各地政府间数据开放差异的未来演变趋势如何。
02
文献综述
关于电子政务和移动政务使用满意度影响因素的研究一直是信息系统领域的研究热点,也是研究综合类政务服务APP使用满意度影响因素的重要文献基础。Gotoh[18]、Alawneh等[19]、Kumar等[20]基于技术接受模型等经典文献,构建模型实证了电子政务系统的易用性、质量和安全性等对满意度有正向影响。Taherdoost[21]、王法硕等[22]对移动政务APP使用意愿及其影响因素进行研究发现,APP综合水平、系统易用性等因素能产生正向显著影响。孔欣[23]实证了平台相对优势、平台信任与网络外部性感知等对用户的使用体验与满意度产生正向影响。盛红等[24]的研究表明,任务与技术匹配程度等对使用意愿产生正向影响。陈婷等[25]采用ISM-MICMAC模型从感知功能价值、感知交互价值、感知风险价值三个维度,对22项移动政务APP用户满意度影响因素进行了定量分析,并强调了系统价值、信息价值、服务价值、安全价值等因素的显著作用。Lee等[26]着重探讨了电子政务网站设计的“温度”,即电子政务网站满足使用者诉求的友善性、有用性等人文关怀,将正向影响用户满意度。这些影响因素为本研究编码提供了理论参考。
特别地,综合类政务服务APP的推广和使用往往具有制度刚性,探讨其使用满意度必须将此特定情境纳入考虑。已有研究发现,制度压力是影响综合类政务服务APP使用满意度的重要因素。现有研究将国家和政府出台的政策作为一种制度压力[27],集中探讨场域内受政策、法规等影响的行动者的战略响应[28]。具体而言,为了达到提高政务办事效率、规范有关行为等目的,政府研发并制度性推广综合类政务服务APP[29],例如在疫情防控期间,为更好地保证广大人民群众的身体健康,地方政府要求市民在出行时必须使用相关综合类政务服务APP提供核酸检测证明或健康证明。这样的推广将形成制度压力,使用满意度的影响因素在这种情境中发挥作用,且它们的作用与在“非承压”情境中时存在明显差异,但具体机制并未充分探讨[29]。
2.1 服务接触三元模型和服务接触满意度模型
目前学界关于政府数据开放研究主要集中于发展现状、政策分析、平台建设和影响因素等方面。在发展现状方面,众多学者以省级或地市级政府数据开放平台为研究对象,研究结果显示,政府数据开放虽取得一定成效,但存在数据开放专项政策不完善[3]、数据开放动力不足[4]、数据利用程度低[5]和数据开放平台建设滞后[6]等问题,建议应着重优化政府数据开放的组织层、数据层、利用层和平台层[3,7]。
在政策分析方面,政府数据开放政策发挥着关键的指导引领作用,成为学界研究的一大热点。政策研究多是基于政策形式、政策工具和政策内容构建政策分析框架进行文本分析,研究结果表明,存在政府内部协同性差、政策体系不完备、政策工具使用不均衡、政策执行力度不足和数据服务意愿低等问题[8-11]。
在平台建设方面,数据作为我国的战略性资源,是政府数据开放平台的主要输出内容[12],数据质量关系到政府数据开放平台的建设质效[13]、同时也关系到各地政府数据开放平台发展的均衡性[14]。更有研究者认为,数据分类、数据检索方式[15]和数据可读性[16]同样至关重要,建议从数据资源建设、数据组织与检索和数据服务方面提升平台建设质量。
在影响因素方面,主要分为内部因素和外部因素,内部因素包含组织结构、管理能力、技术能力和组织文化等,并与政府数据开放成效保持正向关系[17-18];外部因素包括财政税收、公众需求和顶层压力等[19-21]。
另外,也有少量学者关注到了政府数据开放存在差异性,但相关研究主要基于国家大数据综合试验区,或对京津冀区域展开分析,利用熵值法对比研究当年的政府数据开放差异,指出京津冀三地之间数据开放发展不平衡,影响地区政府数据开放水平的主要因素是数据应用和数据使用,并在分类导航、数据排序与检索和目录开放方面与其他区域存在较大差异[22];或对长三角区域政府数据开放进行考察,从数据集数量和数据总量、数据分类等方面对比异同,认为该区域12个城市间差异明显,数据体量和质量不容乐观,数据可视化能力匮乏,需构建责任协同的利益共享机制,推动区域一体化发展[23-24];或对珠三角和汾渭平原进行研究,从政府数据开放构建要素入手探讨地区间的差异,指出经济驱动力和政治驱动力是造成区域差异的主要原因[25]。
综上所述,国内外学者对政府数据开放议题进行了多维分析,形成了较为丰富的研究成果,但较少学者关注到政府数据开放差异主题,其在研究空间上仍有待继续拓展与深化。①相关研究主要集中于单一省份或局部区域分析,缺乏对全国省份以及东中西区域的对比考察,也尚未着重量化政府数据开放差异程度。而本文以全国省级政府数据开放平台为分析对象,原因在于省级平台对下级平台具有引领和示范作用,分析省级政府数据开放差异有利于从宏观层面把握整体的差异程度和差异来源等,若省级层面差异明显,那下级层面的均衡情况则不言而喻。将其划分为东中西部区域,分析三大区域间政府数据开放差异,并加强对欠发达区域研究的重视,有利于弥补政府数据开放研究领域和范围的偏狭。②以往研究对于政府数据开放区域差异的实际程度和演进趋势的定量分析较少,且基本仅从政府数据开放构建要素出发对比样本,部分利用熵值法对政府数据开放进行综合评价的研究仅停留于表层差异的罗列。而本文则选择在量化视角下递进性地、深入地探明政府数据开放在总体、不同维度和不同区域中的差异程度,从而采纳专注于差异研究的Dagum基尼系数和核密度估计方法,其具有可比性强、客观检测平衡状态和精准预估未来演进趋势的特点,能对政府数据开放各方面的差异情况作出科学、真实的解释。③已有研究较少考虑时间维度,仅以某一年的政府数据开放成效为分析对象,难以较为全面地把握政府数据开放的动态发展趋势,而本文则将纳入时间考量,进行纵向与横向的对比研究。
因此,本文基于我国政府数据开放平台发展现状,根据《中国政府数据开放报告》,从准备度、平台层、数据层和利用层四个维度和东中西部三大区域出发,对政府数据开放的基本差异、差异程度及差异演进趋势进行深入探究。为了解决上文所提出的关键问题,保证研究的完整性和逻辑性,本文分析框架为:首先,为了得出政府数据开放总体差异情况,采用熵值法测度2019—2022年21个省份政府数据开放水平综合指数及四个子维度指数,以分析政府数据开放水平的总体特征、维度特征和区域特征;其次,为了进一步深入解析政府间数据开放差异情况,继而采用Dagum基尼系数分解法,将不同省份的基尼系数进行比较,以探明全国和东中西三大区域政府数据开放的总体差异、区域内差异和区域间差异及差异来源等;最后,为预测政府数据开放差异的未来演进趋势,选择采用Kernel密度估计探究政府数据开放及四个子维度的绝对差异、分布延展性和极化程度等。研究框架如图1所示。
图1 研究框架
03
研究设计
3.1 研究对象
3.1.1 数据来源
“中国开放数林指数”是我国首个专注于评估政府数据开放水平的专业指数,由复旦大学数字与移动治理实验室发布,其邀请了国内外近百位专家来共同制定政府开放数林指标体系,以精准测量我国政府数据开放效果,受到了我国各级政府和学界的广泛认可,因此,将政府开放数林指数作为数据来源具有一定的可靠性和准确性。但是,该报告仅公布了每年各省的得分情况,尚未对数据结果进行进一步的处理和完全的深入解读,尤其是针对维度差异、区域差异和时空差异等方面。同时,考虑到2017—2018年的报告数据缺失严重,本文最终采纳了数据内容较完善的2019—2022年报告作为数据来源,并选取了报告中的准备度、平台层、数据层和利用层四个成熟维度作为切入口,进一步分析各省份在维度、区域和时空上的差异,力争得到较为全面和有价值的研究结果。
3.1.2 数据处理
鉴于各省份在四年间均存在数据缺失问题,为了保证数据的可获得性和完整性,本文按照数据完整度≥80%的标准来选取案例省份,最终确定报告中具备较为完整数据的21个省份作为案例对象。另外,针对报告中的个别数据缺失值,本研究利用线性插值的内插法和外推法来补齐面板数据中的空白位,该方法具有简便、精确的特点,由StataMP.17软件中的ipolate和epolate命令完成。
3.2 研究方法
3.2.1 熵值法
目前,学术界存在众多有关各项指标权重的计算方法,例如AHP层次分析法、因子分析法、主成分法和熵值法等。熵值法具备客观赋权的优点,可最大程度上消除主观因素的干扰,能够实事求是地反映各个指标对于整体的重要性,保证结果的准确性。各项指标的属性均为正属性,指数越大则表明政府数据开放建设得越好。熵值法演算步骤如下:
首先,考虑各项指标计量单位不统一,需要对各项指标进行标准化处理。
其次,计算信息熵,即第j项指标的熵值:
最后,计算各个省份的综合指数:
Xαij 、Zαij为第α 年第i个省的第j个指标的标准化前、后的值;Pαij为指标j的权重、E为指标j 的熵值;Ii为各省份的综合值。
3.2.2 基尼系数
Dagum基尼系数即洛伦兹系数,作为衡量不平等程度的重要计算法,由意大利经济学家基尼Gini于1922年依据洛伦兹曲线提出,用以衡量国民收入分配之间的差异[26],具有简单易懂、可比性强和高敏感性的特点。基尼系数G计算公式如下:
3.2.3 核密度估计
核密度估计(Kernel Density Estimation)是一种非参数估计方法,最早是由Rosenblatt和Emanuel Parzen提出[27],通过对观测样本的分布规律进行拟合以解决实际问题。Kernel密度估计普遍用于估计一个未知的概率密度函数,具备稳健性佳、适应性强,灵活性好和连续优化性强等优点。计算公式如下:
上述公式中,f(x)是变量x的密度函数,K (x)代表核密度函数。其中, N为观测值的数量,Xi为观测值,
04
政府数据开放水平测算结果分析
为充分掌握政府数据开放的基本情况,本文采用熵值法对政府数据开放水平综合指数和各子维度指数进行总体以及区域分析,以便为未来区域协调发展政策提供事实依据。
4.1 政府数据开放综合指数及子维度指数的特征
4.1.1 政府数据开放综合指数的特征
2019—2022年我国政府数据开放水平测算结果如表1所示。测算结果显示,我国政府数据开放水平综合指数存在以下两个主要特征:
第一,政府数据开放总体偏低。我国政府数据开放综合指数各省份四年平均得分仅为0.12,低于平均值的省份约占55%,可见政府数据开放整体仍有较大的发展空间。
第二,政府数据开放水平综合指数大致呈现增长态势。由2019年的2.22提高至2022年的2.54,增长幅度达到了14.41%,意味着我国政府数据开放平均水平虽然偏低,但在相关政策、规划指导及实践努力下呈现出向好趋势。
表1 全国政府数据开放水平测算结果
4.1.2 政府数据开放子维度指数的特征
根据区域政府数据开放水平测算结果来看,2019—2022年整个观察期中四个子维度指数变化趋势迥异。
其中,利用层的增幅在四个维度中最为突出,这主要来源于东部省份的重要贡献,东部综合指数占全国的67.8%。东部省份政府数据开放在成果多样性、成果数量与质量,以及成果价值等方面都取得了较好的成效,数据开放利用和成果转化为我国经济与社会带来巨大价值[28-29],例如上海(0.500)、浙江(0.470)和山东(0.433)等东部省份是利用层维度的“排头兵”。反观准备度维度,其在各维度中指数最低,甚至部分年份有下降趋势,这表明准备度是我国政府数据开放建设中的短板,原因在于目前仍然有许多省份尤其是中、西部一些落后省份的准备基础薄弱。在统计结果中西藏、新疆和内蒙古在准备度维度出现“吊车尾”现象,在早期政府数据开放准备面近乎停滞,颁布的“政府数据开放”相关政策文件仅为宏观性指导,缺乏细节性指导建议,“标准规范”和“组织推进”的指标评估均不达标,导致政策效果大打折扣,建设基础相当薄弱。而准备度良好的共通点在于相关政策和工作计划制定充分以及获得高层领导支持[30]。因此,为保证数据开放的可持续性,可借鉴头部省份的做法以提高上层领导对数据的重视程度,完备以数据开放为主题的政策法规,制定相关标准规范。
4.2 区域政府数据开放水平的特征
4.2.1 区域政府数据开放水平综合指数的特征
首先,从总体水平来看,政府数据开放呈现出东部>中部>西部的发展格局,区域综合指数大小依次排序为东部、中部和西部。
其次,从变化趋势来看,东部区域波动上升,中西部区域呈现温和平缓的变化趋势。具体看图2(a),2019—2022年三大区域政府数据开放水平走势略有差异,东部区域呈现出波动上升的态势,从2019年的1.311增长到2022年的1.719,年均增长率为9.46%;中部和西部区域呈现温和平缓的变化趋势,且在个别年份略有下滑。
最后,从发展趋势来看,东部具有较大提升潜力,中部建设力度有望提升,西部建设明显滞后。东部区域长期作为“经济发展”的优等生,集聚了海量的数据资源并奠定了牢固的发展基础,具有较大的提升潜力。中部区域居于东、西部之间,发挥着承东启西的区位优势,加大建设力度则有望得到较大提升。西部区域政府数据开放水平建设偏低,在考察期间一直位于末位,这可能是由于受历史和地理限制,经济发展起步晚,数据建设方面也存在较大的滞后性,但未来通过自身强化和外部帮助,也能拥有可观的发展空间。由此可知,我国政府数据开放面临显著的区域差异问题,整体上形成东部>中部>西部的格局,且东部区域政府数据开放水平增速相对较快,而中西部存在不同程度的滞后趋势。
4.2.2 区域政府数据开放各子维度指数的特征
2019—2022年我国政府数据开放水平测算结果为进一步发现三大区域政府数据开放综合指数差异的原因及其来源,本文对三大区域的四个子维度指数进行了分析,详见图2(b)—(e)。
第一,从变动趋势来看,三大区域的四个子维度指数均呈现波动态势,或先升后降,或先降后升。这表明我国区域政府数据开放各维度指数发展较为不稳定,主要原因可能在于政府数据开放进程起步较晚,事物发展初期易受到内外部冲击而出现波动。
第二,从增长率来看,利用层、平台层和数据层的指数增长率最高均为东部区域,从东到西依次为37.35%、7.31%和0.60%。但准备度指数增长率最高则在西部区域,为18.44%,其主要原因可能在于东部区域发展早,具备良好的准备基础,准备度上升空间小,把更多的注意力投入到政府数据开放的平台维护、开放协议制定、数据集获取与展示、数据质量保证、数据安全维护和成果转化等质量提升方面,从而推动利用层、平台层和数据层水平整体性提升。例如,山东省的有效数据集总数与数据容量位居全国首位;浙江省的开放数据集在单个数据集平均容量上已为全国第一;上海市为产出更多创新成果,建立大数据联合创新实验室,并连续八年举办“开放数据创新应用大赛”,积极推动公共数据资源的深度应用和增值开发。而在准备度维度,西部地区起步晚,数据开放建设基础薄弱,缺乏清晰的指导规划,迫切需要打造好政府数据开放的地基,相关省份不仅要制定政府数据开放相关文件以指导政府数据开放工作,还要尽可能提高法规政策的等级效力、法规政策的专门性,其政策内容包括但不限于数据利用要求、数据安全要求和保障机制等。例如,2021年内蒙古和宁夏分别颁布《内蒙古自治区政务数据资源管理办法》和《宁夏回族自治区数字政府建设行动计划》。因此,在政策推动下,西部地区的准备度指数提升较快。
综上所述,我国政府数据开放总体水平偏低,但政府数据开放水平综合指数整体呈现增长态势,未来有较大的提升空间。目前区域政府数据开放水平形成了以东部>中部>西部为特征的发展格局,具体表现为东部提升潜力最大,中部有望提升,西部明显滞后。并且从上文的基础区域分析结果来看,政府数据开放在区域和各维度之间均呈现出严重的不平衡问题,为了解区域差异的实际程度及成因,需要进一步探究。
图2 2019—2022年三大区域综合指数及四个子维度指数的变化趋势
05
政府数据开放水平的区域差异分析
本文为了解政府数据开放水平的地区差异程度及其来源,采用Dagum基尼系数分解法,对我国政府数据开放水平的总体差异、区域内差异、区域间差异以及区域间的超变密度进行测算,见图3。
图3 政府数据开放水平区域差异大小及贡献率
5.1 政府数据开放水平的区域差异及来源
5.1.1 区域内差异
图3(a)显示了我国政府数据开放水平的总体差异及区域内差异。
(1)总体差异逐渐扩大
从全国政府数据开放总体差异变化趋势来看,政府数据开放的总体差异在逐渐扩大,整体基尼系数从2019年的0.415提高至2022年的0.507,提高了22.17%,年均增长幅度达到6.9%,这主要是由于各省份所拥有的禀赋条件悬殊,在近几年的发展中迅速拉开差距,因此,亟待确立政府数据开放区域协调发展战略,以缩小建设水平差距。
(2)东部差异波动下降,中西部差异逐年上升
从区域内差异来看,三大区域的基尼系数呈现出不同的变化趋势,在经历了几次波动后,最终形成了西部>中部>东部的格局。
西部和中部区域的基尼系数呈现出逐年上升的趋势,年均增长率分别达到了14.2%和24.07%,这主要源于西部和中部区域内部各省份政府数据水平差异过大,例如同位于西部地区的综合指数最高的广西和最低的西藏,四年间两者指数相差高达0.15,这说明广西在准备度、平台层、数据层和利用层中的建设水平较其他西部省份领先,已成为全国首批政务数据开放共享国家标准试点地区,且在2021年政府数据开放排名中位居第六。中部区域则由于四川省和贵州省政府数据开放指数远远高于其他中部省份,两个省份取得的政府数据开放成效已占到了中部区域的62.4%。东部区域的基尼系数呈现出波动下降的趋势,从2019年的0.314下降到2022年的0.295,下降幅度为6.05%,且观察期内平均基尼系数为0.309,为三大区域最低,说明东部区域数据开放水平的差异趋于减小,东部省份建设水平相对均衡。
5.1.2 区域间差异
图3(b)显示了我国政府数据开放水平的区域间差异及其变化趋势。从变化趋势来看,所有地区的区域间基尼系数均呈增长趋势,基尼系数介于0.33—0.61。
(1)东部-西部差异增幅缓慢提高
东部-西部的区域间差异在2019—2020年出现小幅下降后又开始微弱上升,以2019年为例,东部-西部的区域间基尼系数最高,原因在于东部地区政府数据开放水平远远高于西部地区,但随着西部地区的振兴,逐年差距保持在年均增幅2.25%。
(2)东部-中部差异增幅波动上升
东部-中部的区域间基尼系数从2019年的0.33提高至2022年的0.40,同时,在2020—2021年出现较大增幅,随后增幅减小,原因在于2020—2021年例如河南、湖北和山西等中部省份的政府数据开放指数出现快速下降,而东部省份政府数据开放水平均保持提升,从而导致差距扩大。
(3)西部-中部差异增幅急剧扩大
西部-中部的区域间基尼系数在2019年后呈现急剧扩大的态势,2020—2022年两年的增幅高达37.9%,可能的原因在于观察期间中西部政府数据开放指数均值为0.305,而高于均值的省份大部分位于中部区域,其余均分布于西部区域,极差高达0.947,西部省份虽在努力追赶,但中部省份尤其是四川和贵州在近年来政府数据开放建设如火如荼,发展极快,甚至在个别年份超越东部“领头省份”,因此西部-中部区域差距反而越来越大。
5.1.3 区域差异的来源与贡献度
图3(c)绘制了政府数据开放区域间差异来源贡献率的演变趋势,主要包含区域内贡献率、区域间贡献率和超变密度贡献率,贡献率越大,则在一定程度上对政府数据开放差异影响越大。从对我国政府数据开放水平贡献率变化趋势来看,区域间平均贡献率为最高(54.59%),区域内平均贡献率次之(27.80%),超变密度平均贡献率最低(17.40%),可见区域间差异是导致政府数据开放区域差异的最主要因素,东中西部区域政府数据开放差异大的原因可能在于:第一,资源禀赋的先天差异。区域间资源禀赋的差异性是政府数据开放差异的主导原因。第二,区域经济发展不平衡,资金、人才和技术等生产要素向经济发达地区聚集,欠发达地区尽管可能采取相应的弥补战略,但受限于基础薄弱,在短期内推进缓慢。第三,财政投入力度和领导重视程度不同。在政府数据开放建设过程中,持续且稳定的政府财政投入和领导重视是推进政府数据开放的基础保障和动力支撑。综上,现阶段推进区域政府数据开放高质量发展应以缩小区域间差异为重点,各地政府应发挥好统筹协调的作用,注重数据开放的协同性、关联性和整体性,谋篇布局政府数据开放工作,促进区域间政府数据开放的协调发展。
5.2 四个子维度指数的区域差异及其来源
为进一步分析造成三大区域政府数据开放水平区域内差异、区域间差异的原因,本文对三大区域政府数据开放水平的四个子维度进行区域差异分析,以期为区域协调发展提供科学建议(相关分析图见附录)。
5.2.1 区域内差异
从四个子维度总体差异来看,四个子维度的变化趋势迥异,准备度的区域差异呈快速下降的趋势,平台层和数据层的地区差异呈现逐年扩大的趋势,利用层则呈现波动下降的趋势。其中利用层的总体差异是四个维度中最大的,可见,在利用层维度发展不平衡问题较为严重。以2022年为例,利用层指数得分为0的省份高达11个,这些省份几乎仅在准备度维度得到发展,数据层和平台层得分也低于1;而对于利用层得分偏高的省份来说,准备度、平台层和数据层的得分也偏高。可见,政府数据开放的发展存在“金字塔”效应,利用层成效的实现首先需要其他三个维度的稳定积累,是量变达到质变的结果。相关研究也表明,政府对数据利用宣传重视度、用户对数据的需求程度、获取和加工数据的自由度和用户利用数据的便捷度,也会明显影响政府数据开放利用效果[31-33]。例如,山东省在公共数据开放和利用工作中取得了显著成效,原因在于省大数据局着力于数据供需两侧,实现“应开放尽开放”,优化平台功能,提升用户体验。贵州省利用公共数据产出了众多优秀成果,在“成果数量”“成果质量”“成果价值”和“利用多样性与促进”等指标中取得了较好的成绩。
从区域内部差异来看,在准备度维度,东部和中部地区的基尼系数均呈下降趋势,其中中部地区降幅最大,达到55.87%;西部地区基尼系数呈现先急剧下降后快速上升再小幅下降的变化趋势,增幅为17%,表明西部省份准备度发展不稳定,无论是相关规划还是措施落实都缺乏连贯性,对准备度维度建设重视度不足。在平台层维度,中部和西部地区的基尼系数均呈现出逐年上升的趋势,增幅分别为152.09%和60.91%,东部地区呈现波动下降的趋势,降幅为31.67%。在数据层维度,中部和西部地区的基尼系数呈现出上升的趋势,中部地区的增幅最大,高达158.13%,东部地区表现出逐年下降的趋势,表明东部省份数据层差异逐渐缩小,这主要得益于东部省份对数据层的建设成效,以2022年为例,省域有效数据集总数、省域数据容量和单个数据集平均容量排名前10中有50%均为东部省份。在利用层方面,东部、中部和西部的基尼系数均呈现下降的趋势,降幅分别为13.44%、6.53%和7.38%。值得注意的是,西部地区的基尼系数在平台层、数据层和利用层维度中均保持较高水平,基尼系数介于0.6左右,表明西部省份在这三个维度中的差距较大,原因可能在于平台层、数据层和利用层的建设需要大量的人力、物力和财力,而不同省份之间资源条件悬殊,因此差距逐渐拉大。
5.2.2 区域间差异
四个子维度指数的区域间差异(图见附录)。东部-中部、东部-西部和西部-中部的区域间基尼系数呈现出不同方向、不同程度的变化趋势。
(1)东部-中部:平台层和数据层差异是区域间差异的主要原因
东部-中部准备度和利用层的区域间基尼系数呈现下降趋势,降幅分别为28.56%和9.64%;平台层和数据层区域间基尼系数则呈波动上升趋势,增幅为17.54%和26.32%。因此,两大区域间平台层和数据层发展差异的逐渐扩大,是造成政府数据开放水平区域间差异扩大的主要原因。
(2)东部-西部:平台层差异是区域间差异的重要原因
东部-西部准备度、数据层和利用层的区域间基尼系数整体上呈现出震荡下降趋势,降幅分别为16.34%、9.87%、0.39%;平台层的区域间基尼系数出现急剧上升后又略微下滑的趋势,但总体呈上升趋势。因此,两大区域间平台层发展差异的大幅扩大是造成政府数据开放水平区域间差异扩大的重要原因。
(3)西部-中部:平台层、数据层和利用层是区域间差异的主要原因
西部-中部准备度的区域间基尼系数出现“下降-上升-下降”趋势,降幅为33.39%;平台层、数据层和利用层的区域间基尼系数呈现出明显上升的趋势,增幅分别为79.39%、43.90%和2.18%,且其基尼系数绝对值位于较高水平。可见,两区域之间平台层、数据层和利用层发展差异是造成政府数据开放水平区域间差异显著扩大的主要原因。
5.2.3 区域差异的来源及贡献率
根据表2,平台层的区域内贡献率最大,说明平台层的区域内差异是政府数据开放区域内差异的主要来源。准备度、数据层和利用层区域间贡献率比较接近且数值较大,平台层的贡献率较小,说明相较于区域内差异,政府数据开放综合指数的区域间差异主要来源于准备度、数据层和利用层方面的差异,也即取决于区域发展的整体实力。四个子维度指数的超变密度贡献率均值偏低,分别为17.21%、31.77%、21.24%和19.60%。因此,政府数据开放四个维度指数的区域差异主要来源于区域间差异,未来政府数据开放建设应着重解决区域间发展不平衡的问题。
综上所述,从综合水平来看,政府数据开放水平的总体差异正逐渐扩大,东部差异波动缩小,中、西部差异逐年上升,各区域间的差异均在不同程度上有所扩大,区域间差异是导致政府数据开放水平区域差异的主要因素。从各子维度来看,在总体差异上,利用层维度发展不平衡问题最严重;在区域内差异上,东部省份在平台层和数据层维度差异逐渐缩小,中部省份在准备度维度差距降幅最大,发展良好,西部省份在准备度维度发展不稳定,缺乏连贯性,在平台层和数据层维度差距急剧扩大;在区域间差异上,平台层、数据层和利用层的差异都有可能成为各区域差异的主要原因。另外,区域间差异仍然也是四个子维度指数区域差异的主要原因。可见,由于各区域的情况差异,其所擅长的政府数据开放维度也有所不同,相互之间可以相互借鉴,取长补短。
表2 四个子维度指数区域差异来源及贡献率(单位:%)
06
政府数据开放水平的分布动态及其演进
6.1 政府数据开放水平的分布动态及演进
通过Kernel密度估计反映出我国政府数据开放水平的整体形态及不同时期的动态演变,见图4(a)。
图4 全国及三大区域政府数据开放水平综合指数的分布动态
从波峰的移动来看,全国政府数据开放水平的Kernel曲线主峰的位置正缓慢右移,尤其在2019—2021年右移幅度加大,说明政府数据开放水平总体呈上升趋势,这与前文研究结果一致。从波峰的高度和宽度来看,观测期内Kernel曲线波峰高度不断下降,波峰宽度逐渐扩大,说明政府数据开放水平的绝对差异呈现明显扩大的趋势,即政府数据开放水平的省际差距越来越大。从分布延展性来看,Kernel曲线存在明显右拖尾现象,表明我国部分城市的政府数据开放水平显著高于全国平均水平,即存在政府数据开放水平较高的省份,比如浙江、上海、山东和北京等。从极化程度来看,政府数据开放水平分布由一个主峰和侧峰构成,但侧峰峰值相对偏低,说明政府数据开放水平具有轻微的两极分化趋势。
综合来看,我国政府数据开放水平逐渐提升,但存在两极分化的现象,省际差异呈现出不断扩大的趋势。
6.2 三大区域政府数据开放水平的分布动态及演进
三大区域政府数据开放水平的分布动态及演进如图4(b)—(d)所示。
对于东部地区而言,政府数据开放水平的Kernel曲线主峰位置在观察期内经历了“先左移后右移”的过程,总体表现为小幅右移趋势,说明东部政府数据开放水平在波动上升。从分布形态来看,东部区域由“单峰状”转变为“双峰状”或“多峰状”,Kernel曲线由陡峭逐渐变得平缓,且存在左拖尾现象,说明东部地区中低于东部政府数据开放平均水平的省份较多,例如海南、江苏和吉林等,可见东部地区政府数据水平存在一定差距,政府数据开放水平空间分布的非均衡状态逐渐凸显。
对于中部地区而言,波峰位置向左移动,波峰形态呈现高度持续下降、宽度不断扩大的趋势,说明中部地区政府数据开放水平轻微下降,绝对差异呈现显著扩大的趋势;且在2020—2022年核密度曲线开口跨度较大,形态较为相似,说明在此期间中部省际间政府数据开放水平差异程度较为稳定。
对于西部地区而言,政府数据开放水平的核密度曲线主峰位置逐渐左移,曲线的波峰高度呈现先下降后上升的趋势,波峰的宽度也逐渐先扩大后缩小的演变过程,但总体表现为波峰高度上升,宽度收窄,且波峰数量由多个向单个转变,说明虽政府数据开放水平存在下降趋势,但西部地区政府数据开放水平的绝对差异有所缩小。另外,西部地区的核密度曲线存在明显的右拖尾现象,表明随着时间的推移,西部开始出现发展突出的省份,例如广西和宁夏。
6.3 四个子维度指数的分布动态及演进
图5显示了四个子维度整体形态及不同时期的动态演变。
从峰值形态来看,准备度水平的核密度曲线的波峰位置在观测期间并未发生明显位移,波峰高度呈现持续上升、波峰宽度逐渐收窄,说明在政府数据开放中准备度水平发挥较为稳定,绝对差异在逐渐缩小。平台层水平的核密度曲线经历了“先左移后右移”的过程,整体上为右移趋势,波峰高度呈现先上升后下降的局面,波峰宽度逐渐扩大,总体表现为高度下降、宽度扩大,表明平台层水平有所提高,但绝对差异在不断扩大,空间非均衡状态尤为突出。数据层水平的核密度曲线在2019—2022年不断左移后右移,波峰高度逐渐提高又下降,宽度逐渐收窄又拓宽,整条曲线出现波动变化的特征,说明数据层水平的绝对差异在波动变化,时高时低,该维度在建设过程中并不稳定。利用层水平的核密度曲线的波峰位置出现右移现象,波峰高度整体呈下降趋势,在2022年有轻微回弹,波峰宽度逐渐变宽,说明利用层水平虽在提高,但绝对差距出现显著扩大的趋势。
从分布延展性来看,除平台层水平存在左右拖尾现象以外,准备度和利用层均显著存在右拖尾现象,说明准备度和利用层存在较多发展水平较高的省份,数据层存在轻微的左拖尾现象,说明存在较多低于均值水平的省份,而平台层同时存在水平较高和水平较低的省份。
从极化情况来看,准备度和利用层的核密度曲线主要由单峰构成,说明准备度和利用层出现“单极化”特征,而平台层和数据层的核密度曲线基本由双峰构成,即一个主峰和一个侧峰,并且侧峰峰值相对较高,呈阶梯状排列,表明平台层和数据层出现了显著的梯度效应。
综上所述,政府数据开放水平整体呈上升趋势,这与前文结果一致,但存在两极分化的趋势,省际间绝对差异不断扩大。从各维度来看,准备度维度发挥较为稳定,绝对差异逐渐缩小,平台层、数据层和利用层的绝对差异不断扩大,非均衡状态突出。
图5 四个子维度指数的分布动态
07
结论与建议
7.1 结论
本文基于政府数据开放的丰富内涵并结合我国各省政府数据开放工作的实际情况,从准备度、平台层、数据层和利用层四个维度构建政府数据开放评价体系,运用熵值法测度2019—2022年21个省份政府数据开放水平综合指数及四个子维度指数,并对全国整体及三大区域的政府数据开放水平及子维度发展情况进行基础分析,而后利用Dagum基尼系数对全国、三大区域政府数据开放水平及四个子维度的相对差异及相对差异的来源进行分析,最后利用Kernel密度估计对政府数据开放及四个子维度绝对差异的动态演化规律进行刻画,得出如下结论:
第一,综合来看,全国政府数据开放平均水平偏低,但在研究期内呈增长态势,并且政府数据开放水平存在明显的区域差异,整体上呈东部>中部>西部的发展格局,且东部区域政府数据开放水平增速相对较快,而中西部存在明显的滞后趋势。从子维度来看,我国区域政府数据开放各维度指数情况各异,水平波动较为不稳定,其中三大区域中利用层水平最高,西部地区表现最差,可见政府数据开放在各区域和各维度之间均呈现出严重的不平衡问题。
第二,综合来看,全国政府数据开放的总体差异逐渐扩大,区域间差异是导致政府数据开放总体差异的主要来源,其次是区域内差异。就区域间差异而言,所有地区的区域间差异均呈增长趋势,政府数据开放水平的区域间差异在逐渐扩大;区域内差异呈现出西部>中部>东部的分布格局。从子维度来看,四个子维度的区域差异迥异,这主要来源于区域间差异,且各维度的区域内基尼系数大体上也呈现出西部>中部>东部的分布格局。
第三,综合来看,全国政府数据开放水平的绝对差异具有不断增大的趋势且两极化特征突出。同时,除西部区域政府数据开放水平的绝对差异有所缩小外,东部和中部区域的绝对差异均呈扩大趋势。从子维度来看,准备度水平的绝对差异逐渐缩小,数据层水平的绝对差异波动变化,平台层和利用层水平的绝对差异均出现增大的趋势,非均衡状态显著。另外,准备度和利用层呈现“单极化”特征,而平台层和数据层呈现“双极化”特征,且具备显著的梯度效应。
7.2 建议
根据以上研究结论,本文提出如下建议:
第一,控制总体差异,完善政府数据开放协调发展体系。目前中央尚未出台专门针对政府数据开放区域协调发展的独立性政策法规,要实现政府数据开放区域均衡发展,需从国家战略的角度出发开展自上而下的顶层设计。(1)首先,应树立政府数据开放的总体目标和要求,建成“数字中国”和实现新时代政府治理现代化是推进政府数据开放的总目标,这就要求加强政府数据开放均衡发展,构建一套完善的政府数据开放协调政策法规体系,从宏观层面入手对区域均衡发展提出普适性的工作指南、原则和标准规定,旨在对区域间协调平衡做出全局性、长期性和综合性的安排。(2)其次,应引导形成政府数据开放区域协调发展格局,紧扣一体化和高质量要求,贯彻“东部率先、中部崛起、西部开放”的原则,完善倾斜帮扶体系,鼓励区域内龙头省份发挥带头作用,帮扶区域内落后省份,落实区域间的扶持制度、区域指向性制度和传帮带制度等[34],助推政府数据开放欠发达区域的改革和创新;鼓励推行“跨省通办”和“数据互借”等数据开放共享方式,提高区域协同治理能力。(3)最后,应督促地方政府将政府数据开放纳入法治轨道。为提高政府数据开放相关工作的法治进度,一是要求提高政府数据开放政策的等级效力,充分吸引各环节主体的注意力和资源;二是从国家层面制定数据开放、共享、保密、交易及数据再利用的国家标准,使省级政府有据可依,增强地方政府数据开放专项政策的可操作性和有效性。
第二,缩小区域间差异,积极促进政府数据开放区域协同。据上文分析得出,区域间差异是导致政府数据开放水平总体差异的主要因素,因此,缩小区域间差异是推动政府数据开放均衡发展、提高政府数据开放水平的关键环节,需要发挥政府数据开放的区域协同作用。(1)首先,推进区域理念协同。必须充分认识到政府数据开放的价值所在,重点突出准备度、平台层、数据层和利用层的发展要求,在提升政府数字治理水平和助推数字经济的目标上达成共识,理解政府数据开放本质上是对数字政府和服务型政府等理念的深化,保证数据开放的协同实施,助推政府治理现代化进程。(2)其次,强化主体协同。优化跨行政级别、跨部门、跨政策主体的协调配合机制,建立健全全省市联动、政企合作、区域协同的体制机制[35]。在内部协同上,增设数据开放管理协同部门,建立数据开放各维度的责任清单和问责机制。例如,贵州省组建了“贵州省大数据发展领导小组”,大力推进“云长制”,打造了横向协同和纵向协同的组织模式。在内外协同上,加强营造省域间合作文化,建立高效便捷的沟通学习机制。一是创新政府数据开放“传帮带”模式,完成专业人才培养、提高数据开放相关工作人员的综合素养和实际技能;二是形成政府数据开放区域互助联盟,欠发达省份通过查找自身问题、明确需求,对标发达省份优秀榜样,全方位改善数据开放质量。(3)再次,构建制度协同。一方面要重视跨部门政策,明确跨部门协作的主体权责和考核机制,同时各级政府数据开放政策与其他数据开放相关政策之间要相互支持,交叉融合;另一方面要重视部门政策,生成开放环节的工作程序和机制,各区域部门定期围绕数据开放过程如数据采集、处理、发布、利用和隐私安全等举办政策研讨会议,实现区域联动发展。(4)最后,善用技术促使数据协同。合理利用数字技术可有效降低政府数据开放协同的成本,突破区域间数据“割裂”等问题,交换价值高、需求高的数据集,从而实现区域间的互联互通,提升数据利用的价值。技术标准化是完成技术协同的前提,其中包括统一标准建设、统一数据采集标准,统一数据存储方式及处理流程等。政府数据开放平台作为数据共享交换的重要载体,是技术协同的关键环节,各区域省份要完善“目录发布、数据汇集、元数据呈现、检索与获取、互动反馈等功能”[36]。另外,尝试关联数据技术在平台的应用,建立数据间的关联和整合[37],凭借先进技术重塑数据采集和归集的方法以提高数据采集归集的效率,为区域间、部门间数据资源的自由调用打开绿色通道;也要注重利用技术加强政府数据安全保障,建立和完善数据管理制度,提高数据风险识别和预防。
第三,防止绝对差异扩大,充分激活政府数据开放的内生动力。据上文分析得出,未来政府数据开放水平的绝对差异有不断扩大的趋势,为推动政府数据开放平衡发展,最终还是需要各省充分发挥四个子维度协调统筹与有机嵌合的作用,为政府数据的有序开放提供有利条件。(1)针对准备度,一是要做好物质基础保障工作。不仅要成立专门的数据开放主管部门,还要招聘专员专岗开展工作,并提供充足的资金以进行后续的数据搜索、汇集、加工和整理及平台建设。二是推动地方专项政策完善。明确数据开放范围和方式,细化数据质量管理和数据利用方式的要求,以保证当地政府数据开放有规可依。三是提高领导层的关注度。上级领导可在会议或活动等表示对数据开放工作的关心与支持,正向的意愿与表率将提升数据部门和社会对数据开放的认知。(2)针对平台层,一是丰富数据开放平台功能。应科学化设置平台页面,兼顾不同群体需求,及时更新平台数据,优化数据检索、导引功能;改善数据获取机制,细分数据获取申请条件,提供可下载的数据开放目录,设置直接获取、登录获取及分级获取的方式。二是注重用户使用体验。设置高级筛选、在线答疑服务和增添收藏或推送等个性化功能,例如,深圳和贵阳的数据开放平台能直观呈现各数据集间的关联性,用户可通过链接直达相关数据集。(3)针对数据层,一是扩充数据容量,提高质量。广泛收集企业、公众、高校和科研团队等平台用户的需求并提供高价值的数据集;委托第三方对数据集进行评价和排查,通过数据脱敏、加密和水印等安全技术对数据进行修补和完善。二是重视数据规范,扩大开放范围。优化数据集的API服务和增强与用户的互动交流,合理分级分类地逐步增加数据集开放范围。(4)针对利用层,一是支持数据活动多样化。积极创办数据开放创新利用大赛或活动,结合各行各业需求优化数据开放赛事命题,挖掘数据精英,汇聚数据创意,例如举办旅游开放数据创新应用大赛、公共交通领域数据开放优秀案例活动等;二是鼓励数据应用多样化。数据成果的展示不仅限于在APP上,还可尝试服务应用、Web平台、传播产品(自媒体文章、数据新闻等)、论文或研究报告等类型,以展示类型的多元化来激活数据成果的多样化。同时,为利用者开设提交数据利用成果的功能,并标注展示类型、数据来源、提供部门、利用方向等信息。
附录下载地址:https://pan.baidu.com/s/1UYFkYE7XwKmVJfDm70D_3Q?pwd=1111
参考文献
作者简介
*原文载于《信息资源管理学报》2024年第5期,欢迎个人转发,公众号转载请联系后台。
* 引用格式
高凡,徐思佳,李易衡.政府数据开放水平测度、区域差异分解及动态演进——基于21个省份的面板数据分析[J].信息资源管理学报,2024,14(5):59-74,90.
往期 · 推荐
制版编辑 | 周凡倩
审核 | 于 媛
长按识别二维码关注我们
信息资源管理学报
分享、在看与点赞
只要你点,我们就是朋友😊