Law-Tech Series
“”“大数据”已然从热词变成日常,而数据在释放无限潜力
的同时,也引发了隐私泄露的巨大隐患。从若干年前科技公司野蛮生长,到近年来数据立法接踵而至,信息社会正在两极之间寻求平衡。数据脱敏提供了这样一种可能性——通过降低数据与主体之间的关联,可以同时保留较高的隐私保护程度和较大的数据利用价值。
“数据脱敏”专题文章将梳理匿名化、去标识化、假名化等一系列相关概念,分析中国、欧盟、美国等法域对不同概念的法律评价,介绍数据脱敏的技术方案与隐私模型,探讨各个业务场景下的行业实践案例与法律落地方案,以推动数据利用和隐私保护的平衡发展。
匿名化()去标识化()假名化()
对的制定了介绍性指南。将特定机械地对应特定的数据脱敏效果评价各国立法并没有对一类技术进行概括性评价,而是对技术处理所实现的具体效果进行法律评价,因为同一技术可以实现不同程度的脱敏效果。
统计、密码、抑制、假名化、泛化、随机化、数据合成等数据脱敏技术的基本原理,并举例说明同一技术的果跨度。每种技术的特点和阈值各不相同,实践中基于特定的场景和目标,可以适合的技术及从而平衡数据的可用性和安全性。
一、 (一) 1. sampling:从原始数据集抽取若干数量、若干属性的样本,从而使攻击者无法确定目标个体是否在抽样数据集之中。
数据聚合()(二) 1. deterministic encryption(属于非随机加密):通过密钥对数据进行加密。
同态加密()以云计算场景为例在传统,用户需要信任云服务提供商不会窃取甚至泄露用户数据同态加密可根本上解决,同时保护用户的数据和云服务提供商的计算模型。
(三) 1. masking:删除直接标识符或其中一部分,例如将手机号变成。
局部抑制()这种技术Rh(四) 假名化()1. :用假名代替标识符的原始值,并创建假名与原始值的分配表。此处的假名是指的随机值,还可以采取多个原始值对应一个假名)的方式,但这会降低数据的可用性。
基于标识符的假名化/在标识符原始值的基础上的而(五) 泛化()1010100100(六) 随机化()1. :添加随机值噪声到某一属性中,同时尽可能维持该属性的原始统计特征。
置换3. :对某一属性进行排序和分组,接近的属性值分为一组,并用每组的平均值来代替该组的所有原始值。
(七) 数据合成技术()二、 我国的《个人信息去标识化指南》和ISO/IEC 20889《关于匿名化技术的意见》关于脱敏技术的法律评价,应当注意以下几点:不同技术的脱敏不同的脱敏技术有其特点和阈值。例如,统计、泛化、随机化等技术有可能实现名化技术最多实现结合其他信息可识别不借助其他信息不可识别欧盟中特别强调,假名化无法作为匿名化的方法之一,因为假名化虽然降低了数据集和数据主体身份之间的联系,但数据主体仍有可能被间接识别。例如,用户在社交网络上使用的昵称即是一种假名,但结合用户发布的其他信息,仍有可能识别该用户的身份。同一技术的就同一脱敏技术而言,其具体的实施强度也存在差异。例如,身份证号中屏蔽的数字如果是生日而不是最后四位,则安全效果较差,因为个人经常在好友庆生、入职信息表、注册会员等场景下暴露自己的生日,容易还原原始的身份证号。
《关于匿名化技术的意见》3. 也对脱敏技术的法律评价不是抽象的,而是基于具体的应用场景,因为特定的情形会影响技术处理的效果。例如,技术但。假设在某,患有40从40这个统计值中,一般无法识别出患者的身份;但是,41判断出该新。因此,在特定场景下必然。:数据脱敏可以采用及其组合。,,,因此,法律对脱敏技术的评价并不是一刀切的,而是具体考量技术所实现的效果。那么,下一个需要回答的问题是,法律上如何衡量脱敏的效果?下期文章将为您介绍定性、定量这两类衡量标准。
© 2019-2021 All rights reserved. 北京转创国际管理咨询有限公司 京ICP备19055770号-1
Beijing TransVenture International Management Consulting Co., Ltd.
地址:梅州市丰顺县留隍镇新兴路881号
北京市大兴区新源大街25号院恒大未来城7号楼1102室
北京市海淀区西禅寺(华北项目部)
深圳市南山区高新科技园南区R2-B栋4楼12室
深圳市福田区华能大厦
佛山顺德区北滘工业大道云创空间
汕头市龙湖区泰星路9号壹品湾三区
长沙市芙蓉区韶山北路139号文化大厦
欢迎来到本网站,请问有什么可以帮您?
稍后再说 现在咨询