数字经济的核心技术:数据定价

文摘   2022-07-24 17:11  
微信公众号IntBigData: 随着大数据技术应用发展和概念回归,数字经济正成为新经济的增长模式。然而除了产业数字化和数字产业化两个相对传统的数字经济组成部分,以数据要素化为基础的数据定价、交易、治理、安全与应用,是我们认识和理解数字经济的关键。数字经济的三大核心要素,即数据、算法与算力数据方面的挑战有:数据孤岛、数据确权、数据收益分配、安全、隐私、定价;模型方面的挑战有:模型安全与治理、公平性、隐私、价值挖掘。对于数据要素而言,数据定价是一个核心问题,本文下面的内容选自姚期智院士关于数字经济核心技术的介绍,IntBigData做了些补充解释。


当解决了数据流动所需要的技术设施后,如数据安全、隐私计算、数据中台、数据监管可以打造数据要素的流通市场了,这些技术可以帮助我们实现数据确权和分类分级管理,畅通数据交易的流动。其中,最重要的就是形成合理的经济分配机制,从而驱动企业内部的部门独立核算、企业间的数据共享,以形成数据要素市场,实现数据要素市场化配置,合理分配数据要素收益。
要完成这个任务,需要建立数据要素的定价理论与算法,这是一项融合了信息经济学、博弈论、计算机科学的前沿交叉理论,清华与华润集团、华润银行进行了实践性的探索与落地,提供了丰富的业务场景和数据场景,大体介绍如下。
数据是用来建模的,通过数据分析,经济主体可以进行有效的决策,我们把这一过程抽象为决策模型而经济主体,不管是机构还是个人,都希望获取最好的经济价值,这种对经济价值的目标我们可以抽象出来一个功效函数基于经济学理论与数学的推导,可以建立起经济主体的功效函数与决策模型精度直接的联系
目前研究提出了多种大数据定价方法,成本利润是其中一种。但是数据产品的价格不能简单的根据成本和利润来敲定,而是需要一定的技巧。定价不是越低销量就越好,而是企业和消费者的一场心理博弈,想要赢,就要懂得揣摩人心。由此也可以看出,最终的价格是参与博弈的各方所能接受的平衡点。对于数据交易而言,涉及到数据控制者、数据生产者、数据交易者、数据使用者等等参与者,我们可以根据合作博弈理论来确立不同的数据对于决策模型的贡献度,贡献度大的数据要素更有价值。需要注意的是,这里的数据是指最终交易的数据,可以是隐私处理过的脱敏数据。因此,通过经济主体功效函数与决策模型贡献度的耦合,就可以对不同数据要素起到的经济价值做合理公平的定量评估,计算得到数据要素在经济活动中产生的经济价值。
那么,在不同的经济活动中,如何基于数据要素流通的方式赋能经济活动,并在各数据源间分配公平合理的经济价值?
- 基于市场营销的场景,可以在隐私计算的环境下,通过多源外部数据源与内部CRM数据的联合建模,生成智能营销的模型,提高营销获客的效率。
- 基于供应链管理的场景,可以在隐私计算的环境下,通过多源外部数据源与内部ERP数据的联合建模,生成智能调度的模型,提高物流、金融流管理的效率。
- 基于生产制造的场景,可以在隐私计算的环境下,通过多外部数据源与内部MES数据的联合建模,生成智能生产的模型,提高生产的效率。
这些经济效率的提升是基于模型精度的提升,比如精度高一倍的营销模型就可以帮助机构获得多一倍的业务量,这些业务的经济价值是由于使用了多方的数据要素,并建立了更高精度的模型带来的。那么我们就可以通过多方数据合作博弈的框架,建立分配算法,按照贡献度公平合理地分配这些价值。谁的数据对模型精度以及相关联的经济价值贡献度高,谁就应该获得相应更多的经济价值。
简单的来说,这个价值可以用经济主体的功效函数数据的模型贡献度相耦合来进行刻画。
这是一个简单的例子,我们可以用数据来预测贷款违约倾向,识别良好/不良信用的客户,利用来自不同数据提供方的银行贷款信息和申请客户贷款逾期情况信息数据进行隐私计算的联合建模。那么,如何实现对各个数据提供方所提供的数据资源进行定价呢?
如果用传统的分配方式,即按照每个参与方的数据样本数进行分配,是不能反映出来数据的实际价值的。而用模型贡献度进行度量,可以实现这一点,通过模型贡献度的计算我们可得出一些有意思的结论:
• A比E样本多,但贡献值较低。
• C、D样本相同,但C的模型贡献率明显高于D。
• E比C样本多,模型贡献率略低于C。
2021年11月,刘鹤副总理专门提出了要实现数据要素的市场化配置,合理分配数据要素收益。深圳市作为先行示范区更是在全国首次提出了数据资产“入表”的条例草案,探索建立数据要素会计核算制度相应的,在公共数据层面,政府也应该匹配相应的数据财政制度将来源于公共性数据层面的数据收益,通过支出,构建基础设施等支撑体系。

更多阅读:

社会治理:人工智能时代算法偏见的问题与规制
某大数据服务公司的“爬虫”数据采集违法案例解读

大数据怎么买卖?


互联网大数据处理技术与应用
互联网大数据与安全相关的各种技术,包括爬虫采集提取、大数据语义、挖掘算法、大数据安全、人工智能安全、相关技术平台以及各种应用。同时也会分享相关技术研究和教学的心得体会。
 最新文章