数据隐私保护之静态和动态数据脱敏技术
在数据要素成为企业重要资产的当下,对于企业不同的业务部门来说,每时每刻都在通过共享数据方式进行业务协作。一些企业会将大量的敏感客户数据拷贝到开发、测试、数据分析环境,但并没有采取任何对数据脱敏的措施。这将面临重大的监管及数据泄露风险。为了保证数据在企业内外部依法依规使用,需要相应的数据脱敏技术来实现对敏感数据的保护。
法律法规和行业要求,对数据脱敏的时候有相应的脱敏程度要求,比如匿名化、去标识化,其中匿名化是对个人信息处理之后,使得个人信息主体无法被识别。去标识化是处理后不借助额外信息的情况下无法识别个人信息主体的过程。
数据的种类可能有个人隐私数据、企业业务数据,还有数据分级分类之后安全级别很高的核心数据。
脱敏涉及的数据源、数据类型,最早的数据源都是关系型数据库,尤其是数据类型部分以结构化的为主,后续也有了大数据体系的数据源,有了更多非结构化的数据。最早数据脱敏的主要是针对数值和文本这种很基本的数据类型,现在对于图片、对音频、视频都有脱敏的需要。
数据的可用范围,正常情况下敏感数据是只能存在于生产环境中,经过脱敏之后就可以在测试环境中存储、在开发环境中存储以及对外部开放访问。
一、静态数据脱敏
静态脱敏简单说就是对数据进行批量化脱敏。静态脱敏应用的场景,主要为结构化数据或数据统计信息,数据集的可用性不能被破坏,这种情况适用于静态脱敏。一般用在测试开发或者是对外进行完整的数据集外发的场景中,主要特点是数据会发生批量的转移。
静态数据脱敏系统面向敏感数据通过脱敏规则进行数据变形,实现敏感信息的可靠保护。系统实现自动化发现源数据中的敏感数据,并对敏感数据按需进行脱敏规则变形,避免敏感数据泄露,脱敏后的数据保持了数据的一致性和业务的关联性,应用于开发测试环境、数据交换、数据分析、数据共享等场景。同时对脱敏过程进行监控审计,对数据敏感数据源、敏感数据类型、脱敏任务进行多维度的统计并进行图形化展现。
1、开发、测试使用场景
在开发、测试等场景当中,用户会使用到大量的数据,如果直接使用未经脱敏的生产数据,若涉及个人隐私数据则不合规,海极易造成敏感数据泄露。
1)静态脱敏系统根据不同数据特征,内置了丰富高效的脱敏算法,脱敏方案主要使用数据仿真、随机字符串、列关联的方式进行;
2)不要求全量数据,根据开发测试环境的具体要求拟定脱敏方案;
3)脱敏主要通过数据库到数据库的模式进行。
2、手工脱敏场景
企业中主要由内部相关人员进行手工或者编写简单的函数进行脱敏,占用大量人力和时间,且脱敏效率太低,导致数据大量失真,无法进行任务计划、断点续传等。
1)静态脱敏系统根据不同数据特征,内置了丰富高效的脱敏算法,脱敏方案主要使用数据仿真、随机字符串、遮蔽的方式进行;
2)可根据具体要求拟定相应的脱敏方案;
3)脱敏主要通过数据库到数据库的模式进行。
3、数据外发场景
在数据外发场景中涉及业务数据接口调用和数据上报给第三方,在使用接口开放给第三方数据共享或者部分数据上报给外部的第三方或上游组织,若数据中包含未经脱敏处理的敏感信息,数据一旦泄露后果将会非常严重。
1)静态脱敏系统根据不同数据特征,内置了丰富高效的脱敏算法,脱敏方案脱敏方案主要使用遮盖的方式进行;
2)保证主外键一致、业务关联一致、有依赖字段的敏感信息脱敏一致、多次脱敏结果保持一致等,整体保证脱敏前后一致性,保持数据间的逻辑关系,数据需要业务库与脱敏后的数据文件一一对应;
3)脱敏主要通过数据库到数据文件的模式进行;
4)可通过水印管理,对泄漏的数据进行快速溯源。
二、动态数据脱敏
动态脱敏则是相反的,一般是对数据进行实时脱敏,常用于对外提供访问接口的时候,外部可以访问数据,实时获取数据的场景。
动态数据脱敏系统是一款高性能、高扩展性的动态数据屏蔽和脱敏产品,在数据库通讯协议层面,通过SQL 代理技术,实现了完全透明的、实时的敏感数据掩码能力;在不需要对生产数据库中的数据进行任何改变的情况下,依据用户的角色、职责和其他 IT 定义规则,动态的对生产数据库返回的数据进行专门的屏蔽、加密、隐藏和审计,确保业务用户、外包用户、运维人员、兼职雇员、合作伙伴、数据分析、研发和测试团队及顾问能够恰如其分地访问生产环境的敏感数据。
在应用侧,脱敏后的数据可以保留原有数据的特征和分布,无需改变相应的业务系统逻辑,实现了企业低成本、高效率、安全的使用生产的隐私数据;在运维侧,对敏感数据进行遮蔽处理,既不影响正常运维工作,又能够保证数据安全。
1、业务脱敏
老旧系统无法再做升级改造以及开发时未考虑数据隐私保护问题,重新修改代码过于复杂,只能依赖于外部技术实现数据的隐私保护。
1)敏感数据自动发现,能大大减少了脱敏产品部署时用户的配置工作量,增强了系统的易用性;
2)利用三层关联技术,可对不同业务帐号、不同业务模块配置脱敏策略,在业务系统本身无法限制业务人员查询信息时,可通过数据动态脱敏系统针对不同级别的业务人员进行权限管理,从而反馈不同的数据信息;
3)无需对应用系统进行改造、无需修改数据库及存储数据,即可实现数据动态脱敏。
2、运维脱敏
动态数据脱敏系统能有效的保障内部运维环境下的数据安全,防止敏感数据泄露。
1)对于DBA 等数据运维人员,可限制其在操作某些敏感表或越权操作其他数据表时返回的数据为非真实数据;
2)对于运维人员恶意或失误进行高危或高风险操作时进行阻断,防止其危害数据库;
3)支持透明网桥部署模式和本地代理模式;
4)全面的审计记录:告警级别、事件发生时间、客户端IP、目标数据库IP、操作类型、客户端MAC 地址, 客户端端口号、返回状态、结果信息、客户端执行命令等。
综上所述,在面对具体的脱敏应用场景时,需要对一个完整的数据集进行脱敏,脱敏过程中还要保持数据的特性,保持数据特性之后才能从中挖掘出数据价值。数据脱敏可以在有效降低数据风泄露风险、保护数据安全的同时,不对数据的可用性产生影响,是既保证安全又挖掘数据价值的优选技术。