首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
数字经济的核心技术:数据定价
文摘
2022-07-24 17:11
微信公众号IntBigData: 随着大数据技术应用发展和概念回归,数字经济正成为新经济的增长模式。然而除了产业数字化和数字产业化两个相对传统的数字经济组成部分,以数据要素化为基础的数据定价、交易、治理、安全与应用,是我们认识和理解数字经济的关键。
数字经济的三大核心要素,即
数据、算法与算力
。
数据方面的挑战有:数据孤岛、数据确权、数据收益分配、安全、隐私、定价;模型方面的挑战有:模型安全与治理、公平性、隐私、价值挖掘。
对于数据要素而言,数据定价是一个核心问题,
本文下面的内容选自姚期
智院士关于数字经济核心技术的介绍,IntBigData做了些补充解释。
当解决了
数据流
动所需要
的技术设施后,如数据安全、
隐私计算、数据中台、数据
监管
等
,
就
可以
打造数据要素的流通市场了,这些技术可以帮助我们实现数据确权和分类分级管理,畅通数据交易的流动。
其中,
最重要的就是形成合理的经济分配机制,从而驱动企业内部的部门独立核算、企业间的数据共享,以形成数据要素市场,实现数据要素市场化配置,合理分配数据要素收益。
要完成这个任务,需要建立数据要素的定价理论与算法,这是一项融合了信息经济学、博弈论、计算机科学的前沿交叉理论,清华与华润集团、华润银行进行了实践性的探索与落地,
提供了丰富的业务场景和数据场景,大体介绍如下。
数据是用来建模的,通过数据分析,经济主体可以进行有效的决策,我们把这一过程抽象为
决策模型
。
而经济主体,不管是机构还是个人,都希望获取最好的经济价值,这种对经济价值的目标我们可以抽象出来一个
功效函数
。
基于经济学理论与数学的推导,可以建立起经济主体的
功效函数与决策模型精度直接的联系
。
目前研究提出了多种大数据定价方法,成本利润是其中一种。但是数据产品的价格不能简单的根据成本和利润来敲定,而是需要一定的技巧。定价不是越低销量就越好,而是企业和消费者的一场心理博弈,想要赢,就要懂得揣摩人心。由此也可以看出,最终的价格是参与博弈的各方所能接受的平衡点。对于数据交易而言,涉及到数据控制者、数据生产者、数据交易
者、数据使用者等等参与者,我们可以根据合作博弈理论
,
来确立不同的
数据对于决策模型的贡献度
,贡献度大的数据要素更有价值。需要注意的是,这里的数据是指最终交易的数据,可以是隐私处理过的脱敏数据。
因此,通过经济主体功效函数与决策模型贡献度的耦合,就可以对不同
数据要素起到的经济价值
做合理公平的定量评估,计算得到数据要素在经济活动中产生的经济价值。
那么,
在不同的经济活动中,如何基于数据要素流通的方式赋能经济活动,并在各数据源间分配公平合理的经济价值?
- 基于
市场营销
的场景,可以在隐私计算的环境下,通过多源外部数据源与内部CRM数据的联合建模,生成智能营销的模型,提高营销获客的效率。
- 基于
供应链管理
的场景,可以在隐私计算的环境下,通过多源外部数据源与内部ERP数据的联合建模,生成智能调度的模型,提高物流、金融流管理的效率。
- 基于
生产制造
的场景,可以在隐私计算的环境下,通过多外部数据源与内部MES数据的联合建模,生成智能生产的模型,提高生产的效率。
这些经济效率的提升是基于模型精度的提升,比如精度高一倍的营销模型就可以帮助机构获得多一倍的业务量,这些业务的经济价值是由于使用了多方的数据要素,并建立了更高精度的模型带来的。那么我们就可以通过多方数据合作博弈的框架,建立分配算法,按照贡献度公平合理地分配这些价值。谁的数据对模型精度以及相关联的经济价值贡献度高,谁就应该获得相应更多的经济价值。
简单的来说,这个价值可以用
经济主体的功效函数
与
数据的模型贡献度
相耦合来进行刻画。
这是一个简单的例子,我们可以用数据来预测贷款违约倾向,识别良好/不良信用的客户,利用来自不同数据提供方的银行贷款信息和申请客户贷款逾期情况信息数据进行隐私计算的联合建模。那么,如何实现对各个数据提供方所提供的数据资源进行定价呢?
如果用传统的分配方式,即按照每个参与方的数据样本数进行分配,是不能反映出来数据的实际价值的。而用模型贡献度进行度量,可以实现这一点,通过模型贡献度的计算我们可得出一些有意思的结论:
• A比E样本多,但贡献值较低。
• C、D样本相同,但C的模型贡献率明显高于D。
• E比C样本多,模型贡献率略低于C。
2021年11月,刘鹤副总理专门提出了要实现数据要素的市场化配置,合理分配数据要素收益。深圳市作为先行示范区更是在全国首次提出了数据资产“入表”的条例草案,探索建立
数据要素
会计核算制度
。
相应的,在公共数据层面,政府也应该匹配相应的
数据财政制度
,
将来源于公共性数据层面的数据收益,通过支出,构建基础设施等支撑体系。
更多阅读:
社会治理:人工智能时代算法偏见的问题与规制
某大数据服务公司的“爬虫”数据采集违法案例解读
大数据怎么买卖?
互联网大数据处理技术与应用
互联网大数据与安全相关的各种技术,包括爬虫采集提取、大数据语义、挖掘算法、大数据安全、人工智能安全、相关技术平台以及各种应用。同时也会分享相关技术研究和教学的心得体会。
最新文章
如何高薪?基于应届生薪资数据采集与分析
我的美餐(诗三首)
计算机相关专业中那些形象有趣的词汇
2024《网络数据安全管理条例》来了,对爬虫设计运营有什么影响?
OpenAI o1来了,值得关注的三个显著变化!
人工智能安全课程讲什么?来看看新版PPT!
从大数据的角度看ChatGPT
为什么现在大多数的大模型都是decoder-only?
口令中竟包含哪些隐私信息,需要在破解中采取隐私保护技术?
程序员们,老板让你抓高德地图数据,你该怎么办?辞职吗?
人工智能安全课程讲什么?来看看新版PPT!
“脆皮大学生”的数据分析与启示
维特根斯坦对【AI未来】的16条启示
全民国家安全教育日|三句话聊安全
郑维民|算力的互联与互通
RAG、大模型、Gemini与知识库
思考|为什么大模型看起来很全能?
奇怪了,上证指数最近走势和这个公众号(IntBigData)关注人数变化的相关性达0.8
网络伦理和社会伦理双重标准分析
OpenAI奥特曼被解雇的背后:人工智能安全与商业赢利之争
CESI:知识图谱与大模型融合实践研究报告
基于大模型的可解释股票收益序列预测
和AI一起创作中秋的诗与图
基于大模型的金融风险预测:画像微调
金融风控大模型:从规则对抗到模型对抗
AlphaTensor的矩阵乘法算法自动化解读
人工智能安全(PPT、Python实例、概要视频)
智能时代必读的《人工智能安全》
爬虫案例: 网络安全顶刊(TIFS/TDSC)十年的热点变化
数字经济的核心技术:数据定价
MIT Technology Review 2022年“全球十大突破性技术”之(口令、权益证明与AI合成数据)解读
元宇宙里还有爬虫吗?
数据分析: 茅台视角下的半导体-国产软件-大数据-网络安全上市公司
自动编码器:DAE、VAE、CoAE、Adversarial AE ...
论文导读:自然语言处理中的后门攻击
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉