本文带你了解基于AI的分类(技术)如何为传统的数据安全态势管理(DSPM)带来变革,并能够准确、自主的洞悉数据风险。了解传统基于规则的DSPM的局限性,以及为什么组织机构需要采用基于AI和ML的下一代平台以应对当今的数据威胁。
多年以来,组织机构一直依赖传统的数据安全解决方案。这些解决方案涵盖的策略都是严格基于规则、采用人工分类技术并且不具有灵活性,因此很难满足企业不断变化的需求。创新的人工智能(AI)技术提供了前所未有的速度和准确性。以下是新旧两代平台的五点不同之处。
智能数据分类智能数据分类
传统的DSPM系统通常依赖于严格的基于人工管理的模式匹配技术,如正则表达式(RegEx),进行分类数据。虽然RegEx是一种标记数据的有效的技术,但它容易产生误报。RegEx需要手动验证和优化过程,这严重制约了分类的效率。即使经过手动调优,RegEx也容易产生噪声误报,导致无法完全采信输出结果。例如,传统的工具经常将任何9位数字误认为是涉密的社会保障号码(SSN,译者注:美国的社保号码由9位数字组成)。
现代的DSPM系统基于AI和机器学习(ML),能够分析复杂的数据模式和语境,因此能更准确地进行信息分类。例如,命名实体识别(NER,又称“专名识别”)技术可以识别这些9位数字中哪些是SSN、税务ID或银行路由号码,哪些是不那么敏感的9位员工ID。现代DSPM系统在数据分类方面提升了准确性和效率,降低了运营成本,并增加了组织机构对工具输出的信任。
文件级分类
传统的DSPM工具无法对文件进行分类并识别业务情境。但若要实施强大的数据保护和记录管理过程,文件级上下文又是至关重要的。例如,在患者的诊断报告中的医生姓名应比在医疗营销传单中的医生姓名具有更高的机密性。
现代的DSPM已经集成了人工智能技术,能够准确地区别文件的分类,如会议纪要、诊断报告、简历和员工工资条等。这使得组织机构能够应用更精细和上下文相关的安全措施,确保敏感信息得到妥善处理和保护。
学习环境
传统的DSPM系统大都采用一刀切的方法进行分类,因此不得不专门为每个客户用例编写正则表达式,这严重制约了实施的效率。此外,随着组织机构的数据演变,(匹配)模式必须持续更新。
现代的DSPM解决方案利用AI技术深入理解各个组织机构独特的动态数据环境。例如,现代工具可以自动学习并分类环境中特有的数据(如内部ID号码和文档类型等)而完全不需要手动调优。通过学习到的数据类别,系统能够确保囊括所有相关的数据类型并妥善保护。
情境感知分类
传统的DSPM系统在处理数据时,无论处于何种情境,都采用相同的分类。例如,传统的工具可能对所有健康信息采取一致的策略,无论它涉及客户还是员工,也无论它是可识别的还是匿名的。
更先进的基于AI技术的平台会帮助安全团队理解这些数据代表什么,并能够精简响应和补救的工作流程。这使得数据安全工作更高效且有针对性。例如,如果所有的人力资源员工突然能够一个包含客户数据的文件夹,而他们通常没有访问客户数据的权限,现代的DSPM会将其标记为高风险并触发额外的(访问)控制机制。通过识别此类情境威胁,这些解决方案能够在事件发生之前主动降低风险。
总结
为了更清晰地表述(上述内容),我们归纳了下面的表格,用以比较基于AI的DSPM系统和传统DSPM系统的主要区别:
特性 | 基于AI/ML的DSPM | 传统DSPM |
智能分类 | - 利用AI进行情境分析 | - 依赖严格的正则表达式 |
文件级 分类 | - 利用AI识别文件类型 | - 无法区分文件类型 |
学习环境 | - 自动学习并保护数据 | - 一刀切分类 |
情境感知分类 | - 丰富的数据情境- 主动识别情境威胁 | - 统一的数据处理 |
文章来源:
https://cloudsecurityalliance.org/blog/2024/08/08/transforming-data-security-how-ai-and-ml-is-shaping-the-next-generation-of-data-security-tools
本文翻译来自CSA翻译组:
翻译:崔崟,CSA大中华区专家
审校:张坤,CSA翻译组轮席组长
推荐阅读