1 / 3
【发展现状】
在国内,专业的数据脱敏系统一直等到 2017 年前后才开始真正引起客户的关注。那之前,
数据脱敏需求主要是由客户方面自行编写脚本,或通过一些具备数据转换能力的 ETL 工具
来解决;而国际主流厂商的数据脱敏产品,也主要是在“测试数据管理套件中提供专门的数
据脱敏模块”。
近几年,随着市场刚需的不断增长,越来越多的用户对数据脱敏工作给予重视,同时要求数
据脱敏技术要能够更加适应不同行业的数据特点与业务特征——比如证券行业的业务数据
脱敏需要保持证券的关联信息和证券号特征;而医疗行业的医疗影像文件脱敏和电子健康档
案(EHR)文件脱敏也有其针对性的要求等等,这些都对当前数据脱敏系统的技术水平与产
品功能提出了更多、更高的要求:
1. 支持对关系型数据库、大数据组件、半结构化文件的脱敏处理;
2. 根据不同的脱敏场景需要,支持源库脱敏、跨库脱敏、异构数据库脱敏、数据库到文件脱
敏、文件间脱敏、文件到数据库脱敏等丰富的脱敏方式;
3. 支持遮蔽脱敏、仿真替换、随机脱敏等多种脱敏手段,同时满足脱敏规范、满足不可逆、
满足去标识化等脱敏要求;
4. 支持的数据类型需能够满足常用的个人信息脱敏;
5. 根据不同的数据使用场景,脱敏后数据满足高仿真、数据一致性、脱敏结果可用等要求;
6. 更加智能、自动化地对敏感数据进行自动识别、自动脱敏算法匹配以及脱敏过程处理,
从而提升脱敏效率、质量和准确性。
【需求场景】
1. 开发测试场景
为了能更好的模拟真实生产环境中的数据来进行系统测试,需要将生产环境的数据经过脱敏
后用于开发测试环境。因此,需要通过数据脱敏系统,帮助用户实现以下目标:
(1)高效、便捷地完成数据脱敏处理,以帮助客户快速搭建开发测试环境的数据模型;
(2)脱敏后的数据高度仿真,数据功能不受影响;
(3)脱敏后的数据离散度能够满足测试要求。
评论