

随着数据安全法、个人信息保护法的落地,数据安全受到了越来越多的关注,而如何保护数据安全也成为了企业责任与义务。数据脱敏可以在不影响数据使用的前提下,保护敏感隐私数据,同时满足数据安全要求和业务对数据的使用需求。所以脱敏技术已经成为保护数据安全的重要方式之一。本文通过对数据脱敏技术做全面分析,为更好地实施数据脱敏技术提供指南。
1. 多套数据安全政策法规出台
数据安全事关国家安全和数字经济发展,近年来各级政府及监管部门越来越强调对敏感数据的安全防护,相继出台了多部关于数据安全的法规。数据脱敏是数据安全体系中的重要一环,是落实合规要求的必要措施。

2. 数据使用需求和数据安全需求存在矛盾
数据脱敏就是通过对原始数据进行处理,以形成不携带真实信息但属性仿真的假数据,供业务开发/测试使用,在满足业务需要的同时保证了数据安全性。
数据脱敏分为静态脱敏和动态脱敏两种,各有特点和适用的场景。
1. 静态脱敏
静态数据脱敏(Static Data Masking):一般用于非生产环境,将生产环境的数据经过脱敏后在非生产环境使用,一般用于解决测试、开发库,需要生产库的数据量与数据间的关联,以排查问题或进行数据分析等。静态脱敏是单次处理批量数据。

2. 动态脱敏


下面列举几类脱敏算法:
1. 泛化技术
泛化是指在保留原始数据局部特征的前提下使用一般值替代原始数据,泛化后的数据具有不可逆性。
2. 扰乱技术
扰乱是指通过加入噪声的方式对原始数据进行干扰,以实现对原始数据的扭曲、改变,扰乱后的数据仍保留着原始数据的分布特征。
3. 抑制和有损技术
抑制是指通过隐藏数据中部分信息的方式来对原始数据的值进行转换,又称为隐藏技术。有损是指通过损失部分数据的方式来保护整个敏感数据集,适用于数据集的全部数据汇总后才构成敏感信息的场景。


1. 与各级规范标准的结合日益紧密
随着国家和各行业对于数据安全立法的持续深入,用户在使用个人信息时需要符合更多不同规范。数据脱敏在帮助企业减少敏感数据泄露风险的同时,还可以确保用户对于个人信息数据的使用合法合规。后续数据脱敏技术与各级实际规范相结合,形成能够直接帮助用户实现合规的数据脱敏工具将成为一大探索方向。
2. 智能化数据脱敏技术广泛应用
随着数据维度和种类不断增多,人工指定脱敏规则将会花费更多的时间,人工指定脱敏规则将逐渐难以为继。我们更希望脱敏系统能自动识别敏感数据并匹配推荐合适的脱敏算法。
随着机器学习技术的应用,集敏感数据自动化感知、脱敏规则自动匹配、脱敏处理自动完成等能力为一体的智能数据脱敏技术将成为新趋势。
3. 数据脱敏性能持续提升
1. 针对不同业务场景,该如何选择最合适的脱敏技术;
8. 脱敏系统对国产化平台的支持能力不足,兼容性有待提升。
1. 敏感数据发现及定位能力
2. 脱敏策略及规则匹配能力
3. 丰富的数据源支持能力,满足复杂应用场景
1. 脱敏系统与其他系统联动

2. 智能化脱敏及审批
(1)为提高测试数据使用效率,以及自动化脱敏需求。搭建管控用一体化的国产化数据脱敏平台,打通‘生产-测试’环境,搭建一体化测试数据沙箱。

(3)实现敏感数据动态脱敏和敏感数据删除监测等工作。
参考资料
[1]https://blog.csdn.net/itworld123/article/details/122976264
[2]https://zhuanlan.zhihu.com/p/519960919
[3]https://baijiahao.baidu.com/s?id=1747818552122441 450&wfr=spider&for=pc








