摘 要
随着万物互联、云计算和人工智能等技术的推广应用,我国千行百业的业务活动,能够直接生成越来越多的二维和三维原始数据。在我国新质生产力发展的要求下,建好、管好各类业务活动的原始数据,是用好大数据,实现数据驱动科学决策和监督管理等的前提、基础条件。为建构我国的数据资源管理体系,提出了组织数据生态系统理论。并且,以雄安新区为例,阐释该理论在雄安新区基本建设数据资源管理的价值作用。
新质生产力发展视域下的我国基本建设数据资源管理研究
——以雄安新区为例
1 引言
人类社会正从使用人人相连的信息技术,走向使用人物相连、物物相连的智联技术,这导致了组织机构的业务活动,能直接生成越来越多的原始数据。客观、真实的原生数据,正成为关键的生产要素和国家的战略资源。放眼全球,正是认识到大数据及其基础设施的价值作用,各国政府都积极推进政务数据开放、智慧城市以及产业互联网等建设。其中,在构建国家政务数据开放系统时,2013年,互联网之父蒂姆·伯纳斯·李带领的团队,开始发布《全球数据开放晴雨表》。[1]在2017年5月发布的《全球数据开放晴雨表第四版(2017年)》评估报告的“发现与建议”部分,指出了各国政府数据开放,普遍存在数据不完整且质量低等不足。[2]目前,各国学术界都立足本国的数字化基础,积极探索问题解决之良策。技术界致力于寻求数据完整性之技术解决方案的同时,在管理界,2018年,PAULA等发文,概括指出可能对大数据研究有价值的19个管理理论,即:行为者网络理论(Actor-network theory)、代理理论(Agency theory)、权变理论(Contingency theory)、创新扩散理论(Diffusion of innovation theory)、动态能力观(Dynamic capability view)、生态现代化(Ecological modernization)、博弈论(Game theory)、制度理论(Institutional theory)、知识基础观和无形资产(Knowledge-based view and intangible assets)、知识管理理论(Knowledge management theory)、组织的信息处理观(Organizational information processing view)、资源依赖理论(Resource dependence theory)、资源观理论(Resource-based view)、社会资本理论(Social capital theory)、社会交换理论(Social exchange theory)、社会物质主义理论(Sociomaterialism theory)、利益相关者理论(Stakeholder theory)、技术接受模型(Technology acceptance model)与交易成本理论(Transaction cost theory)。[3]
在我国,随着“千年大计、国家大事”的未来之城——雄安新区(以下简称:雄安),其城市基本建设的整体推进,与物理世界的雄安基本建设活动相伴,正生成日趋发达的雄安基本建设的数据自然界。用好大数据,实现大数据驱动经济社会活动的科学决策和监督管理,首先应建好、管好雄安城市基本建设的原生数据。在我国新质生产力发展的要求下,为有质量地建构雄安地上地下建筑物、构筑物,以及各种管、线、路等工程建设中产生的二维原始记录与三维原生数据,
将尝试运用组织数据生态系统理论,[4]分析雄安基本建设及其数据资源管理。
2 “组织数据生态系统理论”提出的时代背景
党的二十大报告提出建设我国现代化产业体系。2023年9月,习近平总书记在黑龙江考察时提出发展新质生产力。创新与高质量发展,应是中国式现代化建设的努力方向。为建构协同演进与健康、可持续发展的我国现代化产业体系及其大数据系统,“组织数据生态系统理论”,应运而生。在此,主要从原生数据管理与可靠管理技术两个维度,分析组织数据生态系统理论提出的历史及现实逻辑。
2.1 原生数据管理维度
理论上讲,在人类历史长河中,文字、国家产生后,国家的各项事务以及生产、贸易等活动的正常、有序开展,需要有依可据和有凭可证的原始记录及其规范化管理。然而,数字技术的出现及其推广应用,集“内容与载体”为一体的传统文件档案及其管理,开始发生根本性变化。文件档案,不仅继续受到原始记录的形成和管理等跨时间技术作用影响,而且也受到原始记录信息传递跨空间技术作用影响。为此,将从人人相连技术走向万物互联技术的视域,梳理变化中的技术,对原始数据形成和管理的作用影响。
2.1.1 人人相连技术下的原始记录管理。作为世界四大文明古国之一的我国,“国家要进行管理,需要有条理的文书,因而也就产生了档案[5]和档案工作。”[6]在我国,秦始皇统一中国后,开始统一文字、度量衡,建立了皇权玉玺、道路标准化修建等制度安排。我国形成了“以文书治天下”的传统。[7]在我国各个历史时期的国家制度下,作为社会性活动的原始记录,担负着上情下达,左往右来的管理工具与可靠沟通的作用。理论上讲,正是由于国家[8]出现后,作为官府或政府活动相伴而生的原始记录,不是人为杜撰或编造的,而是具体活动自然而然生成的,且需要进行规范性的文书流转与档案管理,我国的文件档案系统,“天生”是真实、可靠的信息系统。从现实维度看,文件档案供给系统,能确保一个国家的各项生产生活正常有序地开展;从历史维度看,规范化管理的文书档案系统的信息传递,也能够如实反映一个国家各个历史时期的生产生活状况以及社会发展历程。
在我国,中华人民共和国成立后,基于我国社会主义政治制度,我国建立集中统一领导,分级分类管理的国家档案事业管理体制。然而,受到“自己形成、自己管理”,以及“秘不示人”“重管轻用”等观念的影响和束缚,加上,缺乏有效地管理档案,合理地控制档案管理成本,以致于迄今为止我国尚未建立发达的档案管理服务,也未建立良好的公共档案开放服务文化。
就此,欧美资本主义市场经济发达国家的档案管理服务经验值得参考与借鉴。比如,法国大革命后,1790年,法国国民议会颁布了国家档案馆条例和关于成立行政区档案馆的法令,拉开了档案法规建设新时期的序幕。[9]1794年6月25日,颁布了世界上第一部专门档案法——《穑月七日档案法令》。该法令规定,法国各级档案馆,都要实行开放原则。[10]再比如,在英国,通过利用已保存的原始记录,能够跟踪调查某一村庄连续五、六个世纪的发展史。并且,十六世纪后,纵横交叠的档案、资料,能反映出95%以上的英国人生产生活情况[11],而继承英国证据文化传统的美国,在建国之初,出于各州政府在美国联邦政府政治分权的需要,就开始从国家层面重视定期进行人口普查,并且重视保存和利用原始记录。这种依靠事实说话,重视数据用于决策支持的做法,逐渐演变成美国国家有机体自觉的“数据文化”。[12]并且,为更经济地管理原始记录,美国首先推出了专业化的档案管理外包服务。20世纪40年代,美国开始建立档案中心(Records Center),[13]专门用来管理海军机关形成的、尚未到移交给国家档案馆的档案,以及海军机关自身仍需留存的档案。此后,世界各国纷纷效仿,建立档案中心、中间档案馆等第三方档案管理服务机构。与此同时,用于指导组织业务活动文件形成和档案管理的“文件生命周期理论”,[14]也应需而生。
计算机的产生,直接导致文件形成和档案管理等技术,开始从使用模拟技术走向使用数字技术。1993年,美国政府启动“信息高速公路”建设后,为助力传统企业信息化,IT企业提出了企业信息化外包服务。追踪看到了,2003年,IBM公司网站推出原始数据存储按需计算的行业解决方案,开始为医院、金融、制造、零售等行业领域的企业,提供原生数据存储第三方服务。[15]
人人相连技术下,欧美国家的档案管理实践,比较注重档案法治建设,有效实现原始记录的管理和提供利用,也重视档案管理服务成本控制。良好的档案管理文化传统,推动着欧美国家形成良好的资本主义市场经济的诚信文化和创新文化。世界各国带着差异化的国家历史、文化传统及社会制度等,走过人人相连的模拟技术时代、信息技术时代,正迈入人物相连、物物相连的数智技术时代。[16]
2.1.2 万物互联技术下的原生数据管理。二十一世纪之后,数字信息技术,开始从传统互联网走向日趋发达的移动互联网和物联网。为更好地服务于公众与企业等用户,2009年,美国政府率先建立以国家为发布主体的政府数据开放平台,开始统一开放政府数据。与此同时,为推进数智技术在社会各行各业的深入应用,2010年,美国IBM公司正式提出“智慧城市”建设;2012年,美国通用电气公司提出“产业互联网”建设。
互联技术,与智能、云计算、大数据等技术的集成应用,这直接导致了社会自然界正从需求方的信息用户,难以确定所获取信息真伪的信息时代,迈向能有效实现复杂性组织业务活动原生数据的形成与管理系统建设,并可以按需供给大数据的大数据时代。就我国而言,我国的政务数据开放、智慧城市以及产业互联网等建设,既应学习、借鉴国外行之有效的管理经验,进一步做好我国企业、政府等传统组织的数字化转型,也亟待探索我国复杂性组织的原生数据系统的建设。合理控制我国大数据系统工程总体拥有成本的同时,也促进我国传统组织的数智化系统与产业互联网之间,实现协同演进和健康、可持续发展。实践界积极探索的同时,我国学界也亟待深入研究。
2.2 可靠管理技术维度
前面谈到,作为组织业务活动相伴而生的原始记录,不仅受到文件形成和档案管理等跨时间技术的影响,而且也受到原始记录信息传递跨空间技术的影响。并且,分析了跨空间数字信息技术,正引发原始数据管理的变化。在此,将分析原始记录的形成和管理跨时间技术,对原始数据及其管理的作用影响。概括来讲,迄今为止,可将组织业务活动的原始记录书写和载体等技术,划分为模拟技术和数字技术两个发展阶段。
2.2.1 模拟技术阶段。在人类社会漫长的模拟技术时代,为如实地记录生产生活过程,先人们就地取材并经过一定的加工,用作了记录载体和书写材料。例如,作为四大文明古国之一的我国,使用了甲骨、简牍和纸质等作为主要载体材料,并先后使用刻、写和印等记录手段。东汉之后,我国造纸技术进步及其推广应用,带动了笔、书写材料等技术也持续改进。公元404年,桓玄下令,官府文书,“皆以黄纸代之”。[17]我国率先进入以纸质材料作为主要载体的文件档案可靠信息时代。由于传统的文件档案,是内容与载体的集合物。相对来讲,档案管理,易于满足真实性、准确性、完整性和安全性等基本要求。然而,受到笔、纸等材料、技术以及形成方式的局限,模拟技术环境下,组织业务活动难以直接生成大量的原始记录。同时,纸质档案信息内容,也不便于远程、便捷地提供利用。
2.2.2 数字技术阶段。20世纪40年代计算机的发明,特别是数据库系统的出现,这导致文件档案的记录工具和载体材质,开始发生根本性的变化。美国政府提出“信息高速公路”建设后,人人相连的数字信息技术推广应用,满足了人与人之间跨时空沟通、交流,促进出版物知识传播,以及便于组织与组织之间业务交往的同时,也出现了文件档案信息内容及其管理,受到前所未有的挑战。经济社会各项业务活动的正常、有序开展,既需要快速、便捷的信息传递通道,也需要确保所传递信息内容是齐全完整与真实可靠的。正像陆军等指出的,发达的网络信息体系,既需要解决信息形式逻辑的正确性,也需要解决信息辩证逻辑的真理性。[18]
近两年,随着万物互联,与云计算、区块链、人工智能、大数据等技术的集成应用,且使用成本持续降低,现实中,键盘、鼠标以及感应、感知设备等数字记录技术,加上原始数据的存储、载体材料等可靠数字管理技术,日趋能满足文件形成和档案管理的需要。数智技术,正替代传统的笔和纸,成为原始记录及其管理的主流技术。就我国而言,在天地空互联技术的支持下,随着我国数字基础软硬件实现了自主可控,组织机构的各项业务活动,不仅能继续生成传统的二维原始记录,而且也生成越来越多的三维原始数据。这直接导致了:一方面,从原始数据需求侧来讲,只要需要,业务活动越来越可以定量化描述,且能用“数”进行实时性、精确化分析;另一方面,从原始数据供给侧而言,与业务活动相伴而生的“数”越来越庞大。多模态、海量原始数据的产生及其管理,引发了以往的档案管理方式甚至管理经验,受到前所未有的挑战。在我国新质生产力发展的要求下,我国的政务数据开放、数智城市的建设,我国的现代化产业体系特别是国家战略性、新兴产业及未来产业的产业互联网建设等,都亟待有相适应的可靠大数据技术解决方案。
3 组织数据生态系统理论及其研究内容
组织数据生态系统理论,是指通过系统梳理业务活动及其原始数据生成和管理的特征,按需建构组织及其原始数据管理的结构与功能。在确保组织业务活动正常开展以及原始数据的真实性、准确性、完整性和安全性等基本要求的同时,也助力组织的原生数据管理系统,实现协同演进、低碳绿色与健康、可持续发展。社会自然界的“组织”,包括简单组织和复杂组织。简单组织,是指传统的企业、政府等组织;复杂性组织,是指城市、行业领域、国家、“一带一路”及地球村等组织。
组织数据生态系统理论的主要研究对象,是业务活动原始数据生成与管理等相关的数据组织、客观数据和组织环境等诸要素及其相互关系。
3.1 数据组织
数据组织,是指组织业务活动原生数据的形成机构和管理机构。数据组织,是组织数据生态系统的主体。万物智联的大数据时代,通过分析数智业务活动相伴而生的原始数据形成和管理等的新情况新问题新要求,理清数智业务数据的生成组织和管理组织及其关系,能助力建好、管好大数据。齐全完整和安全可靠的原始数据管理,能助力用好大数据。
首先,数据形成组织,是指承担具体业务活动及其相伴而生的原始数据形成的部门。数智技术环境下,数据形成组织,既包括承担具体业务活动的部门,也包括负责感应、感知等设备以及智能体采集数据的部门,以及负责向其他数据资源管理系统移交数据的部门,等。
其次,数据管理组织,是指承担组织机构的业务活动相伴而生的原始数据内容管理和原生数据系统运维等职责的部门。[19]在数智技术环境下,原始数据内容管理部门,主要承担对数智业务活动形成的原始数据内容的安全保密、规范管理和共享开放,以及参与确保原始数据系统安全,合理控制组织原始数据总体拥有成本,并且按规定,向相关的原始数据管理组织移交数据内容等;原生数据系统运维部门,主要承担数智业务系统以及原生数据生成、存储等管理技术,以及基础软硬件安全运维,并配合原始数据内容管理部门,向相关的原生数据系统移交数据内容,参与合理控制组织原生数据系统总体拥有成本等。
3.2 客观数据
客观数据,是指在一定的时空环境下,组织业务活动相伴而生的原始数据。这里的数据,不是人为虚构或仿制伪造的,也不是靠事后追忆而形成的信息内容。组织机构业务活动自然而然生成的原始记录,能如实、准确地反映社会自然界的客观对象、活动过程以及相关关系。因此,客观数据,“天生”具有凭证、依据和证据等价值。
天地空数智技术环境下的客观数据,不仅包括组织机构数智业务活动直接以传统文件或记录的方式,形成的原始数据,而且也包括通过感知、感应等设备或智能体采集到的原生数据,以及行业领域和行政区域按需汇集并规范化管理的条、块结合的原生数据。其中,每一个原始数据单元,必须包括内容因子和支持性因子。其中,内容因子,是指原始数据内容;支持性因子,是指背景信息、结构信息,以及原生数据生成和安全管理等相关的软硬件技术条件。
3.3 组织环境
组织环境,是指组织业务活动的原始数据生成和管理等相关的政策法规、技术标准以及组织文化等环境。数智技术下,组织业务活动,正从人人相连走向人物相连、物物相连。这必将对组织环境提出更高的要求。组织环境,可以分为数据组织环境和客观数据环境,也可以分为原始数据供给侧环境和原始数据需求侧环境,等。
随着万物互联的大数据时代各项数智技术的综合应用,只要需要,社会自然界的活动,能以客观数据进行数字孪生体式的实时呈现,也可以历时再现。经济,是人类生存和发展的基础。数字经济发展新趋势,亟待有相适应的社会关系和组织形式,也亟待有相匹配的上层建筑。现实中,由于经济社会活动,存在着竞争、矛盾甚至冲突等利益纠葛,这导致了与组织活动相伴而生的原始数据,也继续存在着保密性、安全性等要求。因此,组织业务活动的原始数据生成和管理,亟待依据不同行业、领域以及不同类型、层级组织的业务活动及其原始数据的具体情况,研究建立相适应的组织环境。
万物智联的大数据时代,社会自然界的生产生活组织及其活动,满足“双碳”目标要求,促进人类命运共同体的和谐共生与协同发展的同时,构建中的复杂性组织的原始数据系统,理应坚持协同演进,低碳绿色和健康、可持续发展。总之,在我国新质生产力发展的要求下,无论传统企业、政府,还是数智城市、国家,以及我国现代化产业体系,特别是战略性、新兴产业以及未来产业等重点领域,都亟待研究相适应的数据组织、客观数据和组织环境。
4 理论应用于雄安新区基本建设数据
资源管理的分析
在我国,为助力整体化、规范化和科学化地推进数字中国建设,自然资源部发布了《实景三维中国建设技术大纲(2021版)》。实景三维中国建设,分为地形级、城市级和部件级等三个层级。[20]其中,地形级和城市级的实景三维建设,将由国家公共财政支持建设;部件级的实景三维建设,鼓励社会力量积极参与。[21]实景三维中国建设,是数字中国建设的空间基底,将为数字中国提供统一的空间定位框架和空间分析基础,是国家新型基础设施建设的重要内容。2022年初,自然资源部又发布《关于全面推进实景三维中国建设的通知》。文件指出,实景三维作为真实、立体、时序化反映人类生产、生活和生态“三生”空间的时空信息,通过“人机兼容、物联感知、泛在服务”,实现数字空间与现实空间的实时关联互通。其中,围绕城市级的实景三维建设,文件指出,到2025年,“5厘米分辨率的城市级实景三维初步实现对地级以上城市覆盖……为数字中国、数字政府和数字经济提供三维空间定位框架和分析基础,50%以上的政府决策、生产调度和生活规划可通过线上实景三维空间完成。”到2035年,“80%以上的政府决策、生产调度和生活规划可通过线上实景三维空间完成。”[22]
在雄安,按照创新、协调、绿色、开放、共享的新发展理念,进行雄安城市基本建设的同时,基建活动相伴而生的原始数据,其形成和管理系统工程建设,亦应如此。组织数据生态系统理论,将助力雄安基本建设原始数据,与实景三维中国建设的雄安空间基底数据等,实现有效对接和管理。该理论的价值作用,主要表现在:
4.1 助力优化建构雄安新区基本建设数据资源管理体系
数智技术下的雄安新区城市建设,是一个复杂性的系统工程。随着辖区内各类基本建设工程的开展,生成越来越多的城建原始数据。雄安新区物理世界基本建设,正形成两类数字世界。一是雄安“数字孪生体”,即构建辖区内基建工程建设原始数据生成和利用的平台系统;另一是雄安“数据自然界”,即构建辖区内基建工程大数据管理基础设施——大数据中心以及数据管理平台系统。组织数据生态系统理论,将助力从数智雄安的整体观、生态观的视域,系统研究构建雄安城市时空大数据系统。首先,在确保业务活动原始数据安全的前提下,分清是建立实时调用的动态原生数据管理,还是满足历时查用的静态原始数据管理,而选择不同的数据资源管理解决方案;其次,如果是满足实时调用原生数据之需,还应与实景三维中国建设中的雄安空间基底数据进行有效对接,从而更好地助力雄安相关业务活动的科学决策和监督管理。
4.2 助力按需进行雄安新区基本建设数据资源管理
数智技术下的我国数据资源管理,应立足我国社会主义政治制度,充分发挥我国新型举国体制的优势,从我国整体观、生态观的视域,系统研究做好顶层规划、合理布局。从宏观来讲,当我国条块结合的各个层级的原始数据管理子生态系统建成,并按需实现了全国范围的互联互通,将标志着我国的大数据管理生态有机体的形成。具体到雄安基本建设,实景三维中国建设形成的雄安空间基底数据,应与物理世界特定场景、基本建设项目原始数据之间进行关联、映射。数智雄安建设下,多模态的原生数据管理,既能满足实时调用数据,也能按需形成、管理和再现客观对应物。组织数据生态系统理论,将助力理清一定时空环境下雄安城市建设相关的、多模态原始数据的来龙去脉,以及彼此关系,并按照实时或历时利用,以及调用动态或静态原始数据等不同情况和要求,进行原生数据的鉴定、处理与存储等管理活动。
4.3 助力合理控制雄安新区基本建设及其原始数据管理成本
《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》提出了加快构建全国一体化大数据中心体系,强化算力统筹智能调度,建设若干国家枢纽节点和大数据中心集群”。[23]我国“东数西算”工程,开始在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地,建设国家算力枢纽节点,并规划建立10个国家级数据中心集群。[24]2024年的政府工作报告,又明确指出,“加快形成全国一体化算力体系,培育算力产业生态。”。[25]
现实中,随着我国的大数据中心和“算力一张网”等系统工程的整体推进,如同西电东送、西气东输和南水北调等国家工程建设那样,我国的IT集成、应用和数据存储等服务,亦能像电、气和水等公共资源那样,实现用多少买多少。[26]因此,“千年大计,国家大事”的数智雄安基本工程建设,既应分析具体基建项目的原始数据生成和管理问题,也应从整体观、生态观的视域,探索雄安辖区内基本建设原始数据,与实景三维中国建设形成的雄安空间基底数据之间的关系,更合理地控制雄安辖区内基础时空数据的总体拥有成本。组织数据生态系统理论,将助力区分不同的基建项目及其原始数据生成、管理等情况和要求,并助力按需选择在线存储(on-line)、近线存储(near-line)和离线存储(off-line)等差异化的原生数据管理解决方案。
5 结语
党的二十大报告已将我国高质量发展,视为全面建设社会主义现代化国家的首要任务。2023年9月,习总书记提出发展新质生产力的新要求。我国治理体系与治理能力的现代化,不仅要积极探索我国社会自然界各项业务活动的创新和高质量发展,而且在我国社会全域、全方位的数字化转型中,也应积极探索我国大数据工程的创新和高质量建设。提出了“组织数据生态系统理论”。组织数据生态系统理论的主要研究对象,是业务活动原始数据生成与管理等相关的数据组织、客观数据和组织环境等诸要素及其相互关系。并且,初步以雄安辖区内的基本建设及其原始数据管理为例,分析了该理论的价值作用。尚待结合我国的各行各业复杂性应用场景,进行深入探索,从而确保我国千行百业的业务活动相伴而生的原始数据形成和管理系统,能实现协同演进、低碳绿色与健康、可持续发展。
关注我们
作者/卞昭玲,李鑫
《档案管理》2024年6期
档
案
管
理