赵伟
本文由知道创宇CEO赵伟撰写并投递参与“数据猿年度金猿策划活动——2024大数据产业年度趋势人物榜单及奖项”评选。
大数据产业创新服务媒体
——聚焦数据 · 改变商业
在中国数字化转型的浪潮中,数据作为核心生产要素的价值愈发显著。2023年10月,国家数据局的成立标志着数据这一新型生产要素正式纳入国家部委的管理范畴,其在数字经济与社会发展中的影响力持续增强,中国大数据产业拥有巨大的市场潜力。
回顾2024年,大数据行业与人工智能的深度融合成为主旋律。ChatGPT等大模型技术的突破性进展,不仅深刻改变了人工智能领域,更为大数据产业带来了全新的发展机遇。然而,大模型技术如同一把双刃剑,在拓展数据价值的同时,也带来了更为复杂和频繁的数据安全风险。2025年,随着大模型应用场景的进一步拓宽,数据安全将面临更大的挑战和机遇。应坚持安全与发展并重,在发挥数据红利、赋能高质量发展的同时,切实加强数据安全治理,提升数据安全保障能力。
数据价值极大增强,安全风险同步攀升
2024年,大数据产业步入了加速发展的全新阶段。各地政府纷纷加快出台大数据产业政策,数据要素、人工智能、智能制造、智慧城市、数字经济等关键词频繁出现在政策文本中,凸显出大数据产业正加速与人工智能等前沿技术深度融合的态势。
在这一进程中,大模型技术的发展与应用尤为瞩目,大模型依赖于大数据提供的丰富资源作为其发展的基石,更通过智能化手段深度挖掘数据价值,实现了数据要素价值的最大化,形成了人工智能与大数据产业相互促进、螺旋上升的良性循环。
大模型已迈入场景化应用的新阶段,特别是在金融、医疗、物流等行业,大模型与具体业务场景的深度融合,不仅推动了行业内部的数据驱动创新,还展现了数据驱动产业创新的经济价值和社会影响力。
然而,随着数据资源被更加深入地利用,数据安全的挑战也随之加剧。大模型的快速发展在极大增强数据价值的同时,也显著放大了数据安全的风险,给数据安全的管理增加了难度。数据安全风险贯穿于数据的全生命周期之中。在采集阶段,过度与非法收集数据是主要风险源;在传输与存储阶段,系统漏洞易遭攻击,导致敏感数据大规模泄露;在数据使用阶段,若权限管理不严或脱敏措施不足,将诱发数据滥用和未授权访问等风险。
步入大模型时代,数据规模激增,数据的流通变得更加频繁和复杂。跨行业、跨部门、跨层级、跨地域、跨系统、跨业务的数据采集、存储、传输、使用等场景日益增多,这一过程中的链路错综复杂,增加了数据滥用、泄露的风险以及潜在的攻击点。
一些新问题在2024年尤为明显。一是,数据的可信性和深度伪造问题尤为突出,大模型会继承或放大现有数据中的问题,不法分子从而轻易地利用掌握的信息进行“深度伪造”技术,实施网络诈骗。二是,攻击者越来越多地利用AI技术进行数据犯罪,如数据黑产和数据投毒,使得自动化攻击行为更加隐蔽且难以防御。三是,面对海量异构数据,数据预处理环节难以做到精准高效,极易埋下安全隐患。隐私数据如果未经彻底脱敏就输入模型训练,极有可能酿成大规模隐私泄露事件。四是随着大模型的迅猛发展,其内容质量与价值观导向却面临着一系列显著的问题与挑战。
知道创宇对全球范围内具有代表性的大模型进行了深入评测,结果揭示了一个令人担忧的现象:多数模型在英文内容的合规性检测上存在显著短板,这不仅体现在对违规信息的识别能力不足,还存在价值观冲突、文化误解、伦理道德风险、以及内容偏见与歧视等多重合规挑战。更为严重的是,这些大模型在甄别并遏制有害信息(例如自杀诱导信息、虚假谣言等)方面显得力不从心,尤其是当文生图技术被应用于未成年人群体时,潜在的风险更是被进一步放大。
这些问题都进一步加剧了数据安全风险,并带来严峻的经济损失。以数据泄露为例,据IBM数据显示,全球数据泄露事件的平均成本在2024年创下488万美元的新高,同比增加10%。这给企业带来了沉重的经济负担,业务损失和泄露后响应成本合计高达280万美元,创下过去6年来的新高。并且,数据泄露的"附加伤害"正在加剧,只有12%的企业能够完全恢复,绝大多数企业的恢复时间超过100天。
数据安全不仅关乎个人隐私和商业机密,更关系到国家的安全和稳定。提升数据安全和治理水平是未来充分激发数据要素潜能的重要前提,如何有效管理并利用好数据,成为当前亟待解决的关键问题。
AI对抗AI成为新常态 催生新产品与新模式
展望2025年,大数据产业将保持快速增长态势,更多企业和行业将积极投身于大数据的挖掘与应用,以期实现商业价值的最大化,并推动自身的转型升级与持续发展。在这一进程中,大模型技术与大数据的深度融合,将激发更多创新性的应用场景,加速各行各业向智能化、数字化转型。在大数据与AI大模型的双重拉动下,算力需求也将进一步增长,从而带动地方经济建设。然而,随着数据资源的深度使用,数据安全风险也随之加剧,成为制约大数据产业发展的关键因素。
为应对数据安全挑战,我国已经出台了一系列法律法规,如《网络安全法》、《数据安全法》、《个人信息保护法》等,对数据安全和个人信息保护制度作了基本规定。同时,国家与部委层面也是频频发文,对保障数据安全提出新要求。国务院发布的《网络数据安全管理条例》将于2025年1月1日起施行,该条例将进一步规范网络数据处理活动,保障数据安全,促进数据的依法合理有效利用。此外,工信部近期印发的《工业和信息化领域数据安全事件应急预案(试行)》也要求提高数据安全事件的综合应对能力。
随着这些法律法规的逐步完善和实施,数据治理进入法治化新阶段,预计2025年数据安全执法力度将进一步加强,国家将更加重视数据安全,为数据安全提供更加有力的法律保障。同时,政策密集落地也将为安全行业的发展带来市场发展机遇,安全企业需要深入理解市场数据合规、数据脱敏等需求,推出更多符合实际业务需求、能够有效应对新兴风险的数据安全产品。
在健全数据安全管理制度,完善治理体系的同时,技术创新成为应对人工智能时代数据安全挑战的重要手段。AI技术以其强大的分析能力和决策支持功能,在数据安全治理中展现出独特优势。
一方面,通过AI赋能,可以更好实现数据全生命周期的安全管理,确保训练数据的收集、聚合和使用可靠,并增强生成内容的可信度,从而防止数据泄露和数据投毒等事件。但需要注意的是,在人工智能时代,单纯依赖人力或机器防控已难以有效应对挑战,必须确立人机协同、优势互补的新思维,并构建完善的人机混合增强智能数据安全治理体系,应当将专家经验全面融入,打造一个人机交互紧密、持续迭代升级的良性循环体系。这一体系将不断增强对复杂数据安全风险的洞察与应对能力,确保数据在其全生命周期内得到妥善的安全管理。
针对大模型所带来的风险,知道创宇实现了AI内容安全检测能力与超算服务的完美融合,构建了多维度内容安全检测场景,全面满足文本、图像、音频、视频等多模态数据的检测需求。公司自主研发了一站式人工智能数据辅助标注平台,支持多种类型的数据标注,实现了人机协同半自动化标注与质检,大幅提升了数据标注的效率和准确性。
另一方面,数据安全治理对安全企业提出了更高要求,安全企业必须紧跟时代步伐,在技术上持续创新,提升防护能力。2025年,越来越多的安全厂商将转向以AI为特色的安全技术,以加强数据安全能力。AI本身既是安全防御的重点,也是安全保障的有力手段,AI能够提供深入的分析和复杂的决策支持,为威胁检测与响应提供强大的智力支撑;基于深度学习的恶意软件检测、用户行为分析等新技术不断涌现,显著提升网络安全的防护能力;AI的自动化和智能化特性也大大提高了网络安全管理的效率,减少安全专家的人工工作,通过自动化检测、响应和风险评估等流程,能够更快地应对网络威胁,减少潜在损失等。
IBM报告显示,采用安全AI和自动化技术的企业,发现和遏制数据泄露事件的时间比未使用这些技术的企业快98天。这表明,善于将AI应用于网络安全中的企业,将能够灵活应对瞬息万变的网络威胁环境,显著提升执行效力和系统的整体弹性。
这一趋势将推动网络安全行业与产品竞争格局的深刻变革。AI赋能的安全产品将具备更强的智能化和自动化特性,能够更快地应对网络威胁,减少潜在损失。同时,AI赋能安全产品离不开海量数据的支撑,具有前瞻性布局云安全、积累庞大安全数据集的安全企业将展现出更强的竞争力。展望未来,AI对抗AI将成为数据安全领域的新常态,激发创新,催生出一系列安全新产品与新模式。
·关于赵伟:
赵伟,知道创宇创始人兼CEO,担任北京市朝阳区政协委员、北京市朝阳区工商联执委,是中国网络空间安全协会常务理事、中国互联网协会理事。曾任全国信息安全标准化技术委员会委员、工业与信息化软件集成促进中心云计算研究专家、中国反网络病毒联盟资深专家、安全联盟创始人、广东省信息安全技术院士工作站特聘研究员、首都互联网协会第四届理事会理事。
赵伟在2024年获评北京市科学技术进步奖二等奖,2023年荣膺“第六届北京市优秀中国特色社会主义事业建设者”、2022年被评为北京市朝阳区最美科技工作者, 2012年福布斯中美30位30岁以下创业者之一,中国消费者协会2015年度十大最美消费维权人物,黑马2016企业服务TOP50人领军人物,获2016-2017云帆奖云计算突出贡献人物奖,获2016-2017云鼎奖中国最具影响力人物奖,入选2021年度中国产业创新百人榜,荣获2021年度中国数字生态领袖称号。