数据脱敏
1. 概述
数据脱敏,是指能够对包含敏感信息的字段通过配置脱敏规则进行数据掩码处理。例如在涉及安全数据或者一些商业敏感数据的情况下,如姓名、身份证号、手机号、账户、地址等个人信息,可对其进行数据脱敏,解决其在非可信环境中的使用问题,实现公司的合规要求。
在本产品中使用脱敏功能需要的操作流程如下:
- (1)设置脱敏规则:由域主或域管理员设置全局的脱敏规则,在规则编辑界面设置规则名称、字段类型和脱敏算法。
- (2)基于列权限应用:由项目管理员在项目中基于数据权限-列权限应用脱敏规则,直接控制对应权限人员的能否查看或导出数据表下的某个字段。
- (3)脱敏展示:当数据字段被应用脱敏规则后,字段在展示过程中将会根据脱敏算法遮盖处理。
2. 功能介绍
2.1 配置脱敏规则
(1)以域管理员或域主身份进入[平台管理]-[域配置]-[数据脱敏规则配置]。
(2)根据需要新建、编辑、删除、排序脱敏规则。
新建和编辑
①规则名称为必填项,不可与已有规则重名
②字段类型分为字符串、整数、小数、日期、日期时间
③脱敏算法有内置算法和自定义算法两类。内置算法包括保留前n后m、保留前n至m、关键词前遮盖、关键词后遮盖、全脱敏五类。
自定义算法复用有数的计算字段语法规则,提供插入代表[当前值]的按钮。其中,方法 REGEXP_EXTRACT_NTH 不能应用于日期时间、日期、整数,方法 AVG 不能应用于文本。脱敏算法 规则详情 保留前n后m 保留字段的前n位和后m位,其余字符替换成 * 保留前n至m 保留从n位至m位,其余字符替换成 * 关键词前遮盖 关键词 X 之前字符替换成 *
关键词可以是特殊字符:" ¥ $ ' & ( ) + - ‘ / . ;: = ? @ % [ ] \ { }关键词后遮盖 关键词 X 之后字符替换成 *
关键词可以是特殊字符:" ¥ $ ' & ( ) + - ‘ / . ;: = ? @ % [ ] \ { }全脱敏 字段显示为6个*,字段数值完全隐藏 自定义算法 套用计算字段的语法来写正则表达式,应对更复杂的脱敏需求 删除:需满足当前规则未被应用于项目数据权限中,否则需先移除后才可删除。
排序
①列表默认排序按创建时间降序,但允许用户手动设置排序(优先级更高)。
②当字段配置了多条脱敏规则时,系统会选择优先级最高的一条脱敏规则生效。脱敏规则的优先级由当前规则列表中的排序决定,排在列表最前面的优先级最高。
2.2 配置数据权限
(1)配置好脱敏规则后,在[项目中心]-[权限管理]-[数据权限管理]-[列权限]中点击[编辑权限]。
(2)选中字段后即可配置脱敏规则,支持对字符串、日期、日期时间、数值类型字段进行配置。其中,在一个列权限内,同一数据库同一表下的字段不可重复配置。
应用范围两种可选,但至少选一个:
①查看:查看报表时,应用了该脱敏规则的字段值,脱敏展示
②导出:导出报表时,应用了该脱敏规则的字段值,导出的Excel/Csv数据脱敏展示
注:导出的报告图片,跟随查看规则,而非导出规则,所见即所得
(3)目前,数据脱敏支持与不支持模块如下表。
支持 | (1)数据连接,预览表、表信息预览 (2)数据模型,阅览、编辑态下的数据视图 (3)报告:图表、表格、交叉表、筛选等 (4)自助取数 (5)大屏、大屏pro (6)数据填报:动态表格、制式表单的动态表组件 |
不支持 | 数据准备和复杂报表模块暂不支持 |
3. 特殊情况处理
3.1 数据源
(1)新建字段:用脱敏字段新建的字段值采用全脱敏显示,一律显示为6个*。
(2)字段类型转换:若原始字段设置了脱敏规则,然后对该字段进行了「字段类型转换」操作,字段类型变为「日期」或「数据」,一律显示为6个*。
(3)地理维度:脱敏后的(经纬度)字段,无法匹配到地理位置。
(4)若一个字段被列权限的禁止查看和数据脱敏两套规则同时命中,则禁止查看优先级更高。
(5)若配置了多种脱敏规则,取优先级最高的脱敏规则。
如小明属于部门A和用户组B,对于同一字段(假设数值为222222):
- 部门A的脱敏规则为:保留前2个和后2个字符,其他替换为*,优先级高
- 用户组B的脱敏规则:保留第1个至第4个字符,其他替换为*,优先级较低
最终小明查看的效果为:22**22\
3.2 报告
(1)筛选:数据脱敏后筛选项会受到影响,无法传递实际值进行筛选。
列表筛选:用户只能盲选下拉框中的值,无法正确传递实际值进行筛选。
文本筛选:用户可以手动输入对脱敏前的数据筛选。
范围筛选:可以按照脱敏前的数据加载范围。
(2)钻取/跳转/图表联动:传递脱敏后的值。
(3)所有涉及到坐标系的图形(柱状、折线、饼图、区域图...)如果度量被脱敏,那么无法绘图。如下图为销售额脱敏处理后的图表呈现。
(4)参数控制器:无法匹配到图表中脱敏后的数值。
(5)报告推送及集成页面,均以脱敏后的结果进行展示。其中集成页面的数据权限以token为依据。
(6)度量预警:如果接收人没有权限,则将以脱敏后的结果进行展示。