2016年欧洲颁布GDPR,2021年我国颁布《数据安全法》以来,2026年再看数据安全时,和之前有了很大的不同,尤其是数据业务工作中,经常遇到一些数据安全认识上的矛盾。今天写一篇文章进行阐述,仅为个人经历,供参考。

从安全合规角度看,需要对全量数据进行分类分级,比如最早运营商行业标准里,划分为用户相关数据和企业相关数据,其中企业相关数据包括网络与系统的建设与运行维护类数据、业务运营类数据、企业管理类数据、其他数据。
开展数据业务时,更多关注业务数据的分类分级,控制业务数据流动才是安全管控的核心,尤其是负责大量数据集中存储和处理的大数据平台,它是数据的“蓄水池和供给站”。
通常每个业务领域内有自己的数据标准,比如卫生健康领域的数据标准、金融领域的数据标准。明确数据标准使得行业内业务系统之间流转畅通、标准统一,采用相同的数据表名称、数据字段名称。
每个数据字段都有明确的含义,因此业务数据的分类分级结果实际已明确。分类分级产品只需要根据【数据标准字段】的列描述信息,识别分类分级结果,无需通过数据内容进行识别。
大部分信息系统在数据采集阶段,根据数据标准的定义,实际已明确了分类分级结果。作为数据承接方,第一步是接收带有分类分级结果的数据,第二步是复核接收的数据分类分级结果的准确性。此外,对于剩余非业务数据或加工衍生数据,才需要通过分类分级产品进行识别。
业务数据的分类分级才是核心,它依赖于数据标准,数据标准通常由行业统一制定。数据分类分级本质上是业务部门的事情,IT部门是配合进行技术侧的落地与执行。

数据分级是为了实现安全管控,不同级别数据采用不同的安全管控措施,逻辑上非常完美,但是落地实践却困难重重。
通常分类分级产品是基于行业规则进行分类分级结果识别,文章前面提到根据数据标准的列描述进行识别,无需根据内容,这是一种做法;另一种做法是,对于没有数据标准的数据,根据数据字典进行明确,以正则表达式、AI大模型对内容进行识别为主。
关于数据分级结果的应用,有几个常见的应用场景:
(1)数据对外共享提供时,对3级、4级字段需要加密处理;
(2)人访问和处理数据时,通过数据库工具连接数据库网关,根据3级、4级数据进行脱敏处理展示;
(3)数据静态存储时,涉及3级、4级数据应进行加密存储;
(4)应用程序使用数据,对敏感数据需要先解密再脱敏展示。
上述场景逻辑上都行得通,但实际会遇到很多困难。比如3级、4级数据很多时,数据加密和解密在技术上会消耗大量资源性能,极大增加了成本。很多数据加工治理本身就需要对明文进行处理,而且处理的是全量数据,需要改造数据加工处理的任务脚本,同时要考虑数据治理平台工具的性能和适配程度。
分类分级产品作为商用产品,涉及分级结果应用时,需要与数据共享网关、数据运维网关等进行定制开发适配,带来附加成本。
当把分类分级结果应用到实际生产业务流程中时,分类分级结果的更新频率和数据的准确度变得至关重要。分类分级产品作为旁路偏识别、统计类的工具,嵌入数据生产业务流程中时,会引发一系列可用性和保障性的问题。

以前的数据安全属于IT领域,安全更多考虑的是产品,这是一项偏安全技术的工作。数据安全主要是关注静态数据的安全保护,比如传输加密、存储加密;对流动的数据加密,需要全面改造应用程序,改造成本非常大,而且存在较大风险。
数据业务形态下的数据传输加密、存储加密成为标配。
在应用程序和数据库之间,通过插件的方式实现数据的动态加解密,这已成为一种非常成熟的技术实现方式。
数据业务将大量的数据集中存储,开展数据治理加工,强调数据开发利用和开放共享,同时关注数据流动中的安全。
正常的业务处理过程需要以明文方式查看这些数据,才能进行数据治理。比如数据质量控制,需要对敏感数据进行校验分析,这与加密存在冲突,对密文数据很难进行数据质控。若把密文数据解密后再进行质量分析,计算性能和成本都会很高。
越来越多的企业将数据安全划分到数据部门,以数据为中心,主要关注数据安全规则的制定、管理要求的下发及落实检查,技术实现由企业IT部门解决。
两者之间存在一些缝隙,比如数据部门开展的数据安全工作,是否应承接数据安全能力的建设?
数据集中起来了,配套数据安全规则和管理要求也应集中管控,个人认为与数据紧密相关的能力手段应由数据部门管理,比如数据分类分级、数据对外共享策略管控、数据API安全管控、数据库运维网关等,这些有助于数据业务安全管控的系统。数据防泄漏、数据库审计、密钥管理等还是放在IT部门比较合适。

IT部门通常是数据基础设施的建设者,包括物理机房安全、服务器设备安全、云环境基础安全、虚拟计算资源、存储资源等安全。从IT部门看,数据和业务程序在IT环境上运行,安全主体责任主要由IT部门承担,包括对内、对外的安全检查和监管。IT属于防守方,防止安全事件发生,降低安全隐患。
业务部门则不同,他们重点拓展业务,把数据转化为企业业绩,增加企业营收,数据流动程度越高越利于业务开展。数据开放程度越高,意味着有更多业务场景和更多的合作机会。
当数据无序流动会给国家、社会、企业带来破坏和影响,出现了数据合规,它决定业务能否正常开展,这是生存的问题。数据安全相比于数据合规,它更加关注风险和安全事件,风险不一定发生,发生了变成安全事件还有一定余地。
因此,数据业务形态下,重点是先做好数据合规、安全合规,再控制过程中的主要风险,把标准的安全管理动作履行完成,是一种比较务实的做法,风险是无法百分百控制住的。