来源 | 零壹智库
10月9日,《中共中央办公厅、国务院办公厅关于加快公共数据资源开发利用的意见》出炉。这是中央层面首次对公共数据资源开发利用进行系统部署,是定规则、把方向的重大制度安排,也是数据基础制度建设的重要一环。
10月10日上午,国新办举行新闻发布会,邀请国家数据局多位领导介绍公共数据资源开发用有关情况,并答记者问。
我国的公共数据资源又有着独特的优势:各级党政机关、企事业单位依法履职,或提供公共服务过程中产生的公共数据,具有规模体量大、数据质量好、价值潜能大、带动作用强的特点。
“加快公共数据资源开发利用,是深化数据要素市场化配置改革的先导工程,是培育全国一体化数据市场的重要抓手,是以数字化助力经济社会高质量发展的重要举措”,国家数据局局长刘烈宏表示。
近年来,公共数据面向支撑数字政府建设,在便利群众办事、优化营商环境等方面发挥了显著作用。但面向服务经济社会发展,在资源供给、应用创新、权益分配等方面,“不敢”“不愿”“不会”的问题比较突出,要素价值未得到充分释放。
未来,公共数据资源的应用将是我国数据要素市场建设的重点工作。但公共数据如何赋能实体经济、扩大消费需求、拓展投资空间、提升治理能力,还存在很多细化和深入探讨的工作。
公共数据的特点
公共数据是指由政府、公共机构或非营利组织收集、管理和发布的数据,这些数据通常是面向公众开放的,可以被任何个人或组织自由获取和使用。公共数据旨在提高透明度、促进公民参与、增强政府效率,并推动社会创新和经济发展。
公共数据的内容可以广泛涵盖多个领域,包括但不限于政府数据、社会经济数据、环境数据、交通数据、健康数据等。
我国公共数据具有规模大、结构复杂、分散和多元化等特点,这些特点与中国的市场、人口、数字经济和政府管理等因素密切相关。
首先,规模大。中国人口基数庞大,公共数据的收集涵盖了海量的个体和家庭信息,包括教育、医疗、社保等方面的数据。由于经济和社会活动的多样性,中国的公共数据来源于多个领域,包括政府部门、企业、社会组织等。
其次,结构复杂。公共数据涉及多个层级(中央、地方、部门等)的数据,数据的种类繁多,涵盖经济、社会、文化、环境等多个维度。且由于各个部门和地区的数据管理体系各异,导致公共数据的格式、质量和标准不统一,增加了数据整合和应用的难度。
第三,分散与多元化。公共数据往往分散在不同的政府部门和地方机构,缺乏统一的管理和共享机制,造成信息孤岛,限制了数据的整合和利用。公共数据包括结构化、半结构化和非结构化数据,涵盖统计数据、地理信息、文本数据等,这使得数据处理和分析的复杂性增加。
第四,数字经济推动。中国的数字经济迅猛发展,促进了公共数据的生成和利用。数字平台和互联网企业收集的大量用户数据为公共数据的分析和应用提供了丰富的资源。企业利用公共数据进行市场分析、产品开发和用户洞察,推动了商业模式的创新和转型。
第五,政府主导。中国的公共数据管理以政府为主导,政府在数据收集、管理和开放方面发挥重要作用。政府通过一系列政策和法规(如《数据共享管理办法》)推动公共数据的开放和共享,促进数据标准化和规范化,保障数据有效利用。
公共数据利用的挑战
公共数据在推动社会发展和经济增长方面具有重要价值,但在实际利用过程中也面临多重挑战。
1. 数据质量与标准化
公共数据往往来自不同部门和地方,这导致了数据在格式、质量和内容上的不一致。不同政府机构可能采用不同的数据标准和采集方法,造成数据整合时的困难。这种不一致性影响了数据的可用性和可靠性,妨碍了有效的数据分析和决策。例如,某地区的健康数据可能与邻近地区在统计口径上存在差异,使得跨区域的公共卫生决策变得复杂。
部分公共数据可能不完整或存在错误,这会直接导致分析结果不准确,影响政策制定和执行的效果。数据缺失会导致样本偏差,而数据错误则可能误导决策者,从而在政策实施中产生不利影响。例如,在经济数据分析中,如果失业率统计不准确,政府可能会在就业政策上做出错误判断。
2. 隐私保护与数据安全
在开放和使用公共数据时,涉及个人信息的部分存在隐私泄露的风险。特别是在健康、教育和社会服务等领域,数据的使用必须严格遵循隐私保护法规。合规性缺失可能导致法律责任和公众信任的下降。例如,开放健康数据以供研究使用时,必须确保所有个人信息均经过去标识化处理,以保护个人隐私。
公共数据的集中存储和开放访问使其容易受到黑客攻击和数据泄露的威胁。这种安全风险不仅影响数据本身的完整性,还可能对涉及数据的组织造成重大的声誉损失。例如,政府数据库遭受攻击后,公众对数据开放的信任度将大幅下降,影响未来的数据共享与利用。
3. 技术与基础设施
数据处理、分析和存储的技术要求较高,部分地区和机构可能缺乏相应的技术能力和基础设施。这限制了数据的有效利用,尤其是在技术相对滞后的地区。例如,许多地方政府由于缺乏先进的IT基础设施,无法对公共数据进行有效的分析和利用。
缺乏有效的数据共享平台和机制,限制了数据的整合与利用。没有统一的开放数据平台,各类数据难以整合,导致重复建设和资源浪费。例如,一些国家虽然有大量公共数据,但由于缺乏有效的访问和共享机制,数据的价值未能充分发挥。
4. 政策与法规
在快速发展的数据环境中,现有法律法规可能无法满足公共数据开放和应用的需求。这导致政策空白,使得政府在数据利用中面临法律风险。例如,缺乏针对数据共享的明确法律框架可能使得政府在开放数据时犹豫不决,影响数据的使用和价值实现。
不同政府部门之间可能存在利益冲突,影响数据的开放与共享。部门间的不协调可能导致数据孤岛的形成,从而影响整体政策的有效性。例如,某些部门可能担心数据开放会影响自身的资源分配和权力,进而阻碍数据共享。
5. 公众信任问题
公众对政府数据的信任度可能不足,影响数据开放的接受度和应用效果。如果公众对数据的透明度和真实性缺乏信任,他们可能不愿意使用或依赖这些数据,甚至可能对政府的政策产生怀疑。例如,数据泄露事件会降低公众对政府发布数据的信任,从而影响未来数据开放的效果。
公共数据在推动创新和社会发展的过程中面临着多重挑战,包括数据质量与标准化、隐私保护与数据安全、技术与基础设施、政策与法规以及公众信任问题。有效应对这些挑战需要政府、企业和社会各界共同努力,建立科学的管理机制和技术平台,推动公共数据的合理利用。
本文摘自《数据经济评论第15期(202409)-公共数据资源与利用》,该报告深入探讨了公共数据资源的内涵、发展历史及其在全球范围内的应用情况,分析公共数据在数字经济时代和人工智能(AI)浪潮中的机遇与挑战,揭示公共数据对AI和数字经济发展的促进作用。报告完整内容请点击文末阅读原文查看。