首页 > 编程知识 正文

表格数据脱敏处理方法,螨虫过敏脱敏治疗方法

时间:2023-05-06 03:31:30 阅读:142753 作者:4212

什么是数据脱敏? 首先什么是数据脱敏? 数据脱敏也称为数据脱隐私,在我们给出脱敏规则和策略的情况下,是对敏感数据,如手机号码、银行号码等信息进行转换或修改的技术手段,避免敏感数据直接用于不可靠的环境。

政府、医疗行业、金融机构、移动运营商等都很早就开始了数据脱敏。 因为他们掌握的是用户最核心的私人数据,所以泄露的情况下后果无法估量。

数据脱敏的应用在生活中比较常见。 例如,我们在淘宝上的购物订单细节,商家账户信息被*屏蔽,保证商户隐私不被泄露。 这就是数据脱敏方式。

淘宝详情

数据脱敏分为静态数据脱敏(SDM )和动态数据脱敏(DDM )。

静态数据脱敏静态数据脱敏(SDM )适用于将数据从生产环境中提取并脱敏,然后分发到测试、开发、培训、数据分析等场景。

您可能需要测试生产数据副本并将其发送到开发库,以便对问题进行故障排除和数据分析,但出于安全原因,您无法将敏感数据存储在非生产环境中。 在这种情况下,必须先从生产环境中对敏感数据进行保密,然后才能在非生产环境中使用。

这样脱敏的数据与生产环境隔离,在满足业务需要的同时也保障了生产数据的安全。

数据脱敏过程

如上图所示,通过交换用户真实姓名、手机号码、身份证、银行号码、作废、无序、对称加密等方案进行脱敏。

动态数据脱敏动态数据脱敏(DDM )通常用于生产环境中,在访问敏感数据时实时脱敏。 因为对于同一机密数据的读取,根据不同的角色和权限执行的脱敏方案不同等,在不同的情况下可能需要不同程度的脱敏处理。

注意消除数据中的敏感内容,同时保持原始数据特征、业务规则与数据的相关性,使其不受开发、测试和数据分析业务的影响,提高脱敏前后数据的一致性和有效性总之一句话:你爱怎么脱就怎么脱,别影响我使用就行

数据脱敏方案数据脱敏系统可以根据不同的业务场景自行定义和生成脱敏规则,可以对有库表的敏感字段,进行数据的无着地脱敏。

脱敏系统

数据脱敏的方法有很多种,下面以下图的数据为基准,逐一示范各方案。

原始数据

1、禁用

作废方案在处理敏感数据时,通过截断、加密、隐藏等方式对敏感数据进行解密,使其没有利用价值。 一般用特殊字符*等代替真值。 这种隐藏敏感数据的方法很简单,但其缺点是用户不知道原始数据的格式。 要获得完整的信息,必须允许用户进行查询。

截止方式

例如,如果将身份证号码替换为*,则为' 220724 ****** 3523 '。 很简单。

隐藏方法

2、随机值

随机值替换,字符是随机字符,数字是随机数字,字符是通过随机替换字符来改变敏感数据的方式,其优点是可以在一定程度上保留原始数据的格式,大多数情况下用户很难理解。

name字段和idnumber字段是随机化脱敏的,但名姓、氏随机化比较特殊,需要相应的姓词典数据支持。

随机值

3、数据交换

数据替换与上述禁用方法类似,不同之处在于此处不使用特殊字符进行掩码,而是用设置的虚拟值替换真值。 例如,将手机号码统一为“13651300000”。

替换数据

4、对称加密

对称加密是一种特殊的可逆脱敏方法,通过加密密钥和算法对敏感数据进行加密。 密文格式与原始数据逻辑规律一致,可以通过密钥的解密恢复原始数据。 应该注意的是密钥的安全性。

对称加密

5、平均值

平均值方案常用于统计场合。 对于数值型数据,首先计算平均值,然后使脱敏后的值随机分布在平均值附近,保持数据总和不变。

原始数据

对价格字段price进行平均值处理后,字段总额保持不变,但脱敏后的字段值均接近平均值60。

平均值

6、偏移和整形

该方案通过随机移位数字数据,移位整形在保持数据安全的同时保证了范围的基本完整性,比以往的一些方案更接近实际数据,在大数据分析场景中意义重大。

例如,在下面的日期字段create_time中,2020-12-08 15:12:25为2018-01-02 15:00:00。

弄整齐

数据脱敏规则经常结合使用多个方案来达到更高的安全级别。

总结无论是静态脱敏还是动态脱敏,最终都是为了防止组织内隐私数据的滥用,防止隐私数据在未脱敏的情况下从组织中泄露出来。 所以作为程序员,不泄露数据是最差劲的行为。

版权声明:该文观点仅代表作者本人。处理文章:请发送邮件至 三1五14八八95#扣扣.com 举报,一经查实,本站将立刻删除。