欢迎点击上方 TMT法律论坛 关注我们
★
NEWS
★
2024年10月21日,国家数据局发布关于向社会公开征求《数据领域名词解释》意见的公告,拟进一步凝聚共识,推动社会各界对数据领域术语形成统一认识。此次征求意见的时间为2024年10月21日至11月20日。
《数据领域名词解释》(征求意见稿,以下或称“《名词解释》”)共对41个名词进行释义,是目前数据治理领域首份专门进行名词解释的权威文件。
以下为《名词解释》全文,我们亦进行了关联注解(非穷尽),供参考如下:
数据领域名词解释
1.数据。是指任何以电子或其他方式对信息的记录。数据在不同视角下表现为原始数据、衍生数据、数据资源、数据产品、数据资产、数据要素等形式。
《数据安全法》- 本法所称数据,是指任何以电子或者其他方式对信息的记录。
《网络数据安全管理条例》- 网络数据,是指通过网络处理和产生的各种电子数据。
《个人信息保护法》- 个人信息是以电子或者其他方式记录的与已识别或者可识别的自然人有关的各种信息,不包括匿名化处理后的信息。
2.原始数据。是指初次或源头收集的、未经加工处理的数据。
3.数据资源。是指具有使用价值的数据,是可供人类利用的新型资源。
《公共数据资源登记管理暂行办法(公开征求意见稿)》- 公共数据资源,是指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的具有利用价值的数据集合。
《浙江省数字经济促进条例》- 本条例所称数据资源,是指以电子化形式记录和保存的具备原始性、可机器读取、可供社会化再利用的数据集合,包括公共数据和非公共数据。
注:当前地方数据立法对于数据资源定义的侧重点并不一致。依据本次《名词解释》,数据资源的定义应强调具有使用价值、可供人类利用价值。
4.数据要素。是指能直接投入到生产和服务过程中的数据,是用于创造经济或社会价值的新型生产要素。
2020年3月《关于构建更加完善的要素市场化配置体制机制的意见》首次将数据作为生产要素提出。
5.数据产品。是指基于数据加工形成的,可满足特定需求的数据加工品和数据服务。
《深圳市数据产权登记管理暂行办法》- 数据产品,是指自然人、法人或非法人组织通过对数据资源投入实质性劳动形成的数据及其衍生产品,包括但不限于数据集、数据分析报告、数据可视化产品、数据指数、应用程序编程接口(API 数据)、加密数据等。
6.数据资产。是指特定主体合法拥有或者控制的,能进行货币计量的,且能带来直接或者间接经济利益的数据资源。
《数据资产评估指导意见》- 本指导意见所称数据资产,是指特定主体合法拥有或者控制的,能进行货币计量的,且能带来直接或者间接经济利益的数据资源。
7.数据要素市场化配置。是指通过市场机制来配置数据这一新型生产要素,旨在建立一个更加开放、安全和高效的数据流通环境,不断释放数据要素价值。
2020年3月《关于构建更加完善的要素市场化配置体制机制的意见》提出“加快培育数据要素市场”。
2022年12月《关于构建数据基础制度更好发挥数据要素作用的意见》提出“完善数据要素市场化配置机制,扩大数据要素市场化配置范围和按价值贡献参与分配渠道”。
8.数据处理。包括数据的收集、存储、使用、加工、传输、提供、公开、删除等活动。
注:与当前《数据安全法》《个人信息保护法》《网络数据安全管理条例》所列举的处理活动一致。
9.数据处理者。是指在数据处理活动中自主决定处理目的和处理方式的个人或者组织。
注:与当前《个人信息保护法》《网络数据安全管理条例》中的个人信息/网络数据处理者定义一致。
10.受托数据处理者。是指接受他人委托处理数据的个人或者组织。
《网络数据安全管理条例》- 委托处理,是指网络数据处理者委托个人、组织按照约定的目的和方式开展的网络数据处理活动。
11.数据流通。是指数据在不同主体之间流动的过程,包括数据开放、共享、交易、交换等。
2022年12月《关于构建数据基础制度更好发挥数据要素作用的意见》提出“完善和规范数据流通规则”“鼓励探索数据流通安全保障技术、标准、方案”“建立健全数据流通监管制度,制定数据流通和交易负面清单,明确不能交易或严格限制交易的数据项”等。
12.数据交易。是指数据供方和需方之间进行的,以数据或者数据各类形态为标的的交易行为。
2022年12月《关于构建数据基础制度更好发挥数据要素作用的意见》提出“统筹构建规范高效的数据交易场所”“出台数据交易场所管理办法,建立健全数据交易规则”等。
13.数据交互。是指主体之间以数据的形式进行交流和协作的过程。
14.数据治理。是指提升数据的质量、安全、合规性,推动数据有效利用的过程,包含组织数据治理、行业数据治理、社会数据治理等。
15.数据安全。是指通过采取必要措施,确保数据处于有效保护和合理利用的状态,以及具备保障持续安全状态的能力。
注:与《数据安全法》第三条中的“数据安全”释义保持一致。
16.公共数据。是指各级党政机关、企事业单位依法履职或提供公共服务过程中产生的数据。
《北京市数字经济促进条例》- 本条例所称公共数据,是指公共机构在履行职责和提供公共服务过程中处理的各类数据。
《江西省数据应用条例》- 本条例所称公共数据,包括政务数据和公共服务数据。政务数据是指国家机关和法律、法规授权的具有管理公共事务职能的组织履行法定职责收集、产生的各类数据。公共服务数据是指供水、供电、供气、公共交通等提供公共服务的组织提供公共服务过程中收集、产生的各类数据。
《交通运输政务数据共享管理办法》- 本办法所称交通运输政务数据,是指政务部门在履行职责过程中直接或通过第三方依法采集、产生、获取的,以电子形式记录、保存的各类非涉密数据、文件、资料和图表等。
17.数字产业化。是指新一代移动通信、人工智能等数字技术向数字产品、数字服务转化,数据向资源、要素转化,形成数字新产业、新业态、新模式的过程。
18.产业数字化。是指传统的农业、工业、服务业等产业通过应用数字技术、采集融合数据、挖掘数据资源价值,提升业务运行效率,降低生产经营成本,进而重构思维认知,整体性重塑组织管理模式,系统性变革生产运营流程,不断提升全要素生产率的过程。
19.数字经济高质量发展。围绕加快培育新质生产力,以数据要素市场化配置改革为主线,协同完善数据基础制度和数字基础设施,全面推进数字技术和实体经济深度融合,持续提升数字经济治理能力和国际合作水平,实现数字技术革命性突破、数据要素创新性配置、传统产业数字化转型和适数化改革,通过数字经济创新发展赋能经济社会高质量发展。
20.数字消费。是指数字新技术、新应用支撑形成的消费活动和消费方式,既包括对数智化技术、产品和服务的消费,也包括消费内容、消费渠道、消费环境的数字化与智能化,还包括线上线下深度融合的消费新模式。
21.产业互联网。是指利用数字技术、数据要素推动全产业链数据融通,赋能产业数字化、网络化、智能化发展,推动业务流程、组织架构、生产方式等重组变革,实现产业链上下游协同转型、线上线下融合发展、全产业降本增效与高质量发展,进而形成新的产业协作、资源配置和价值创造体系。
22.城市全域数字化转型。是指城市以全面深化数据融通和开发利用为主线,综合利用数字技术应用和制度创新工具,实现技术架构重塑、城市管理流程变革和产城深度融合,促进数字化转型全领域增效、支撑能力全方位增强、转型生态全过程优化的城市高质量发展新模式。
2024年5月,国家发改委、国家数据局、财政部、自然资源部发布《关于深化智慧城市发展 推进城市全域数字化转型的指导意见》。
23.“东数西算”工程。是把东部地区经济活动产生的数据和需求放到西部地区来计算和处理,对数据中心在布局、网络、电力、能耗、算力、数据等方面进行统筹规划的重大工程,比如人工智能模型训练推理、机器学习等高时延业务场景,可以通过“东数西算”的方式让东部业务向西部风光水电丰富的区域迁移,实现东西部协同发展。加快推动“东数西算”工程建设,将有效激发数据要素创新活力,加速数字产业化和产业数字化进程,催生新技术、新产业、新业态、新模式,支撑经济高质量发展。
2023年12月,国家发改委等部门发布《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》。
24.高速数据网。是指面向数据流通利用场景,依托网络虚拟化、软件定义网络(SDN)等技术,提供弹性带宽、安全可靠、传输高效的数据传输服务,具有高带宽、低延迟、高可靠性、高安全性、可扩展性、灵活性等特点。
25.全国一体化算力网。是指以信息网络技术为载体,促进全国范围内各类算力资源高比例、大规模一体化调度运营的数字基础设施。作为“东数西算”工程的2.0版本,具有集约化、一体化、协同化、价值化四个典型特征。
2023年12月,国家发改委等部门发布《关于深入实施“东数西算”工程加快构建全国一体化算力网的实施意见》。
26.元数据。关于数据或数据元素的数据(可能包括其数据描述),以及关于数据拥有权、存取路径、访问权和数据易变性的数据。
27.结构化数据。一种数据表示形式,按此种形式,由数据元素汇集而成的每个记录的结构都是一致的并且可以使用关系模型予以有效描述。
28.半结构化数据。不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层的一种数据化结构形式。
29.非结构化数据。是指不具有预定义模型或未以预定义方式组织的数据。
30.数据分析。是指利用技术手段,对数据进行分析,发挥数据作用、释放数据价值的过程。
31.数据挖掘。是数据分析的一种手段,是从大量数据中通过算法搜索隐藏于其中信息的过程。
32.数据可视化。是指将数据以图表、图形、地图等可视化形式展示,以便更好地理解和分析数据。
33.数据仓库。是指一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,通常用于支持企业或组织的决策分析处理。
34.数据湖。是指一种高度可扩展的数据存储架构,它专门用于存储大量原始数据,这些数据可以来自各种来源并以不同的格式存在,包括结构化、半结构化和非结构化数据。
35.湖仓一体。是指一种新型的开放式的存储架构,打通了数据仓库和数据湖,将数据仓库的高性能及管理能力与数据湖的灵活性融合起来,底层支持多种数据类型并存,能实现数据间的相互共享,上层可以通过统一封装的接口进行访问,可同时支持实时查询和分析,为企业进行数据治理带来了更多的便利性。
36.隐私计算。是指在保证数据提供方不泄露原始数据的前提下,对数据进行分析计算的一类信息技术,保障数据在产生、存储、计算、应用、销毁等数据流转全过程的各个环节中“可用不可见”。隐私计算的常用技术方案有多方安全计算、联邦学习、可信执行环境、密态计算等;常用的底层技术有混淆电路、不经意传输、秘密分享、同态加密等。
37.多方安全计算。是指在无可信第三方的条件下,通过特殊设计的密码学算法和协议,允许多个参与方在不泄露各自隐私数据的前提下,协同完成计算任务。
38.联邦学习。是指多个参与方在不共享原始数据的情况下协作完成机器学习任务的方法。
39.可信执行环境。是指提供基于硬件级的系统隔离和可信根,支持基于技术信任的数据安全保障能力,保证在安全区域内部加载的代码和数据在保密性和完整性方面得到保护。
40.密态计算。是指通过综合利用密码学、可信硬件和系统安全的可信隐私计算技术,其计算过程实现数据可用不可见,计算结果能够保持密态化,以支持构建复杂组合计算,实现计算全链路保障,防止数据泄漏和滥用。
41.区块链。是指使用密码链接将共识确认的区块按顺序追加形成的分布式账本。
作者往期文章推荐
中伦解读
域外关注
本期编辑:陈瑊 陈煜烺 陈瑞庭