数据产业新实践:密态计算技术迈向商业化|甲子光年

科技   2024-09-29 16:47   北京  

密态计算技术第一次让数据要素流通这件事在产业端有机会得到大规模验证。


作者|栗子

数据产业的爆发,或许比预期来的更早。


9月27日,一份重量级文件悄然落地,为中国的数据产业发展画下清晰的路径图。


国家数据局就《关于促进数据产业高质量发展的指导意见》(下称《意见》)公开征求意见。意见提出,到2029年,数据产业规模年均复合增长率超过15%;数据技术创新能力跻身世界先进行列,数据产品和服务供给能力大幅提升。


在产业界,数据要素市场的建设正在提速,快速集聚政策、资金、人才和技术。在2024外滩大会上,北京交通大学信息管理理论与技术研究中心特聘教授张向宏预测,到2030年,数据产业规模有望达到7.5万亿元。


前景可期的另一面是,当下数据产业发展面临的制约和现实挑战,也同样是严峻的。


“数据决定了AI能力的上限。但我们看到今天的数据供给严重不足,很多数据主体不愿意供给数据,这对AI和产业的发展都是致命的。”蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬表示,“当前行业数据交易规模已达900亿,离大家预期的万亿、十万亿还有相当的距离,下面仍存在大规模、有深层次价值的数据,需要更复杂的数据融合应用才能把价值挖掘出来。”


寻求这个问题的答案,还是要回归技术突破,以及数据基础设施创新。


9月25日,在第三届全球数字贸易博览会上,杭州市宣布建成全国首个密态计算中心,为数据产业生态中的数据提供方、加工方和使用方等提供全生命周期的密态安全保障和大数据“存算研治用”的全面能力。


这是密态计算技术首次应用在数据流通基础设施的构建中,具有标志性意义。


杭州密算中心由杭州市数据资源局和杭州市发展和改革委员会共同推动,浙江算力科技有限公司与蚂蚁集团旗下的浙江蚂蚁密算科技有限公司联合打造,由蚂蚁密算提供技术支持。


蚂蚁集团副总裁兼首席技术安全官、蚂蚁密算董事长韦韬分享杭州密算中心背后的技术原理


自2016年起,蚂蚁集团就开始布局隐私计算技术和规模化的产业应用,推进技术生态建设和合作,开源可信隐私计算的核心技术,参与国内外技术标准制定等。今年对外公布密态计算技术体系,推动产业实践,并成立密态计算公司——浙江蚂蚁密算科技有限公司。

密态计算也开始迈入了商业化的新起点。



1.数据安全流通的新变量

“数据放在那里没有意义,只有流动起来才会产生价值。”韦韬在访谈中向「甲子光年」表示。

这是产业界当今最大的共识之一。全球产业数字化不断深入,要解决一个三角问题:实现数据价值高效流转、数据安全保护、以及商业可持续。

两个新的变量已经显现:AI大模型横空出世之后,高质量数据供给、数据安全融合等问题,在新的产业变革趋势下,变得更为紧迫;当大规模、高价值的数据流通时代到来,亟需新的技术解决方案和基础设施。

但问题在于,数据作为特殊的生产要素,在流通过程中非常容易容易被拷贝、分割和篡改。

“比如原本你的数据可以卖给行业内的1000个客户,但因为数据极为容易被复制,可能你卖到第10个客户时,整个行业就都有了。”

事实上,数据的价值与风险高度挂钩。数据的价值越大,其潜在风险也越高。

这些“高价值、高敏感”数据一旦泄露,不仅会带来商业损失,还可能因为数据本身所涉及到的个人信息和商业机密而面临法律责任。

一个最典型的案例是,2018年,Meta曾因剑桥分析丑闻中的隐私问题,被美国联邦贸易委员会处以50亿美元的罚款。

另外,比商业损失更严重的问题,是数据产品从供给端和流通端的不足。

据「甲子光年」观察,全国首个大数据交易所——贵阳大数据交易所自2015年4月挂牌以来,近10年累计交易额为47.87亿元;而成立于2021年11月的上海数据交易所,其第一年的交易额也仅突破1亿元。

数据价值释放的载体,是面向产业需求、种类丰富的数据产品。然而,高价值、高敏感数据的供给和流通,过去都因技术上的难题和挑战而难以推进。

数据产品供给的短缺,既缺乏数据融合,也缺少安全高效的研发新范式。当市场不能提供丰富的数据产品时,数据在产业端的大规模应用也就无从谈起。

数据要素流动的安全性问题并非不能保障。在过去很长一段时间里,隐私计算都是行业的普遍选择。

但随着数据进入大规模流通的时代,跨主体、跨机构、跨行业、跨地域的流转成为主流。此时,传统隐私计算技术的限制也逐渐显现。



2.从隐私计算到密态计算

纵观过去几年的市场表现,隐私计算在数据产业中是“看上去很美”的存在。

根据上海数交所此前发布的《2023年中国数据交易市场研究分析报告》显示,2022年中国数据交易市场规模为876.8亿元;然而,分析机构艾瑞发布的《2023年中国隐私计算行业研究报告》指出,2022年同期,隐私计算市场规模仅约12.5亿元。

“传统隐私计算的成本动辄是明文分布式计算成本的千倍甚至万倍,很多企业承担不起。”韦韬向「甲子光年」表示。

而这背后,主要是由于隐私计算技术涉及密码学、人工智能、计算机体系结构等多学科的交叉融合,技术开发难度大、门槛高,研发成本居高不下。

在成本之外,传统点对点的隐私计算难以保证多步计算的中间结果都处于密态,会导致数据泄露及合规风险,并且在处理大规模数据时很容易遇到性能瓶颈。成本、效率、标准不一等等一系列现状,导致传统隐私计算难以支持数据大规模互联互通时代的需求。

面对大规模数据流通需求,亟需新的数据安全流通的技术路线。

现代计算机科学的创新突破,往往也由于规模的指数级增长,倒逼基础设施建设的革命性升级。在近20年来的互联网行业,行业分别经历了大型机、小型机、分布式和云计算等为主导的时代,背后的本质都是围绕数据和计算的变革。

在2024年外滩大会上,阿里云创始人王坚在分享中引用了Pascal的发明人写过的一句话——“一个婴儿的速度的1000倍就是一架喷气机。在我们世界里面,任何事情的规模增加1000倍,它就会发生天翻地覆的变化。”王坚说。

探索下一代的隐私计算技术——这也是韦韬团队在过去几年的核心目标。

今年5月,蚂蚁集团公布了“密态计算”技术体系,并在6月专门成立浙江蚂蚁密算科技有限公司,由蚂蚁集团副总裁兼首席技术安全官韦韬担任董事长,推动数据跨云跨端低成本可信流通。


不同于市场上的隐私计算公司,蚂蚁密算的产品致力于解决更棘手的问题,推动大规模数据的安全流通。

在成立后的三个月来,动作不断:7月的世界人工智能大会上,蚂蚁密算发布了旗下首款产品——“隐语云”大模型密算平台;9月初的2024外滩大会上,发布“隐语云”大数据密算平台;9月底的2024数贸会上,全国首个密态计算中心落地杭州,蚂蚁密算提供技术支持。

韦韬认为,未来大规模高价值的数据要素流转,一定是以密态的形式进行跨云、跨地域和跨行业的流转、融合和计算,密态计算将是数据要素可信流通的重要支撑技术。



3.什么是密态计算?

简单来说,密态计算就是综合利用密码学、可信硬件和系统安全技术的隐私保护计算技术,计算过程中数据“可用不可见”,计算结果保持密态化,以支持构建复杂组合计算,实现计算全链路安全保障,防止数据泄漏和滥用。

“对比传统的隐私计算,密态计算有两个最大的特点:更安全、更便宜。”韦韬表示。

在安全层面,密态计算综合利用密码学和可信硬件等安全技术,确保数据在整个研发周期中全程保持加密状态,实现全链路安全保障不依赖任何数据运维方的管控。在密态管控域中,各方可以对数据进行密态研发,并可以进行跨主体的可信审计。这种全链路数据流转应用的密态保障能力,是数据行业的一个重要突破。

而在成本层面,传统的隐私计算完全不依赖任何可信计算方,因此密码协议的成本和交互成本较高。而密态计算通过引入可信硬件,可以大幅简化密码协议和交互过程,显著降低计算成本并提高处理速度。

除了上述两点之外,数据价值的快速验证,也是密态计算实现数据要素在产业端流通的重要优势。

在韦韬看来,数据价值验证是整个数据流通过程中最重要的标志点。

“因为数据价值往往需要多方验证。假如你能让业务方快速验证数据价值,那么他们一定会积极推进数据要素流通的整个链条。”


多方数据密态汇聚——数据密态研发——数据场景价值高效验证——“数据要素×”聚变效应发生, 这是蚂蚁密算希望通过密态计算在产业界推动的链条反应。

以杭州密算中心为例,由于密态计算的安全性,数据加工方可以像使用明文计算框架一样,编写应用层代码进行数据分析,持续研发出新的数据产品。杭州密算中心可以对多源真实数据进行价值测算和评估,快速匹配数据加工方和需求方,有效解决数据质量评估与产品定价等难题。

当产业中的数据提供方和数据使用方都能够放心去进行数据研发,那么数据要素市场中的数据产品将会更加丰富。加上密态计算更低的使用成本,数据要素无疑将会在产业端实现快速流通。



4.产业落地,密态计算迎难而上

尽管密态计算在技术层面实现了跨越式的提升,但密态计算要想真正实现大规模落地,还有几个现实挑战需要解决。

企业客户最在意的,依旧是数据安全问题。密态计算能否真正保证全链路密态,保障数据全生命周期安全。

对此,蚂蚁密算的解法是,通过综合利用密码学、可信硬件和系统安全技术,计算过程中数据“可用不可见”,计算结果保持密态化,以支持构建复杂组合计算,实现计算全链路安全保障,防止数据泄漏和滥用。

以杭州密算中心为例,为数据在流通过程中提供明确级别、全链路安全保障,覆盖存储、计算、研发、治理和运营的数据全生命周期,包含数据资源密态存储、密态数据使用授权、数据产品密态研发、数据密态流通交易等功能,构建一体化数据要素可信流通体系。


其次,在成本方面,客户也存在一定的考量,密态计算到底能有多便宜?

据韦韬介绍,蚂蚁密算通过可信芯片和机密计算进行协同保障,对于保护极为敏感数据的方案,密算成本控制在明文计算10倍以内;对于保护一般高价值数据的方案,密算成本可以控制在明文计算的2-3倍以内。

他认为,要控制密态计算的成本,需要引入基础设施,像水网、电网一样,为个体和机构提供规模化的服务。有了基础设施,就能够通过规模效应把成本降下来。以杭州密算中心为例,云上的大规模密态计算能力使得处理海量数据更高效,降低单位数据的处理成本。

“密态计算一定是从高价值的数据和场景开始应用,但它解决的是全市场需求。”韦韬说,当规模化后成本降低并突破临界点时,将会迎来大规模的落地。当全链路密态计算的成本是整个数据流通价值的5%左右时,就能够实现规模化推广。

最后是标准化问题。

由于密态计算涉及到的加密算法等技术路线缺乏统一的安全标准和技术规范,导致不同厂商和机构之间难以实现互联互通。韦韬直言,这并不只是国内的问题,而是一个世界性难题。

为了最大程度解决这一问题,蚂蚁密算参与制定了多项技术标准,推动了产学研合作。例如与政府部门、科研机构共同制定数据安全标准,推动数据要素市场的规范化发展。

“密态计算是一个非常严谨的技术,它同样要面临‘安全要求’‘规模复杂度’‘单位成本’的‘不可能三角’。我们希望能够尽最大可能扩大这个三角。”韦韬说。

尽管密态计算在产业侧的落地尚存不少挑战,但已经在金融服务、医疗健康、现代农业等领域落地。


比如,在农业领域,过去农业数字化程度低,涉农数据“孤岛化”,难以满足银行授信风控要求,难以获得信贷支持。农业农村部大数据发展中心与网商银行发起“农户秒贷”项目,通过蚂蚁集团密态计算技术,安全融合多源数据,实时分析,掌握农户经营情况,手机一点就能“秒贷秒批、随借随还”。

截至今年5月,超600万农户获得了银行贷款服务,近8成农户种植面积在10亩以下,是以往农村金融难以覆盖的“毛细血管”。 这一应用入选了国家数据局等发布的首批“数据要素×”典型案例。



5.密态计算的真正价值

如果把数据要素流通比喻成“用水”,那么最早对数据要素的使用就像自家的井水,自产自销;数据点对点流通的隐私计算像是桶装水;而密态计算,则是数据要素流通的自来水阶段的管道技术。

毋庸置疑,杭州密算中心的建立,让国内密态计算的产业化落地迈出重要的一步。

在「甲子光年」看来,杭州密算中心不仅在技术层面确保了数据以密态形式进行汇聚、处理、流通、应用和运营,实现全链路的安全保障,平衡数据安全保护与数据价值发挥,还能将公共数据与产业数据等多源数据进行密态汇聚,通过密态研发加速真实业务场景中的价值验证, 基于技术信任推动高价值数据产品的规模化推广。

这意味着,密态计算技术第一次让数据要素流通这件事在产业端有机会得到大规模验证。

根据《2023年中国数据交易市场研究分析报告》的测算,2030年,中国数据交易市场规模有望达到5155.9亿元。

在「甲子光年」看来,对于产业来说,上万亿规模的数据要素市场就像一个巨大的堰塞湖,产业需要将水源安全且低成本的引入。而密态计算就像产业的水渠一样,让高价值、高敏感数据得以安全、高效、低成本的方式进行流通,数据要素的价值无疑将在产业端得到进一步释放。

而在这一过程中,蚂蚁密算作为今年刚刚成立的,通过持续的技术突破、商业生态和产业合作,给数据产业带来一种新的可能性。

“十几年前云计算刚推出的时候,很多人一开始还没意识到它的价值。但真正上云、上规模后,带来了本质的改变。”韦韬说,“今天密态计算也是如此,我们认为行业将从智算走向密算,这一演变速度及对中远期的影响,将比我们今天想象大得多。”

(封面图及文中配图来源:蚂蚁密算)




END.






甲子光年
甲子光年是一家科技智库,包含智库、社群、企业服务版块,立足中国科技创新前沿阵地,动态跟踪头部科技企业发展和传统产业技术升级案例,推动人工智能、大数据、物联网、云计算、新能源、新材料、信息安全、大健康等科技创新在产业中的应用与落地。
 最新文章