- 大数据隐私保护技术与治理机制研究
- 毛典辉
- 2272字
- 2021-04-02 05:19:25
1.6 研究内容与结构安排
1.6.1 本书的研究内容
针对个人的隐私侵犯问题,需将隐私保护技术与应用场景相结合,考虑整个数据生命周期存在的隐私泄露风险。本书围绕着不同场景、不同生命阶段采取对应的隐私保护技术,鉴于当前国内外相关领域的众多先进成果和空白之处,我们对以下几个方面的问题进行了深入的探讨和研究。
(1)大数据搜集阶段的隐私保护技术(以基于位置服务应用场景为例)
在大数据环境下,数据的海量规模以及飞快的生成速度带来的实时性变化使得传统的被动式隐私保护技术很难适应。与此同时,实施这些隐私保护方法的主体通常是数据搜集者,而没有调动数据生成者的主观能动性,使得他们很少主动地参与到隐私保护系统中。在数据搜集阶段,数据生成者将与自身相关的数据上传给数据搜集者。对于传统的隐私保护技术,仅仅考虑让单个的数据生成者来保护自身的隐私往往是没有效率的。为了节省隐私保护的代价和提高保护的效果,本书将讨论数据生成者们共同来保护自己的隐私,即隐私保护代价共享技术。值得注意的是,这种保护技术只是限定在某些特定的场景中,如基于位置服务等数据生成者可自己来匿名数据,且不影响或者轻微地影响自己享受的服务。第3章介绍了基于位置服务的应用场景,并提出了基于P2P架构与独立架构两种模式下的位置隐私保护技术方案,详细分析了两种模式下位置隐私保护方案的实验过程以及实验结果。
(2)大数据应用阶段的隐私保护技术(以深度学习训练数据集应用为例)
相比于传统的隐私保护技术,大数据环境下的多源数据之间的集成融合及相关性分析使得数据的隐私风险程度大大增加。传统的隐私技术只仅仅针对单一数据集上的攻击假设来指定相应的匿名化策略。然而,大数据的大规模性、多样性使得传统隐私保护技术顾此失彼。因此,本书选取了深度学习训练数据集这一应用场景为例,针对在深度学习模型训练过程可能存在的隐私窃取问题,采用差分隐私保护技术实现数据中用户的隐私保护,第4章提出了两种差分隐私技术与深度学习模型结合的技术方案:基于DCGAN反馈的深度差分隐私保护方法和具有隐私上界的多分组深度差分隐私保护方法,详细分析了这两种技术方案的实现过程以及实验结果。
(3)大数据存储访问阶段的隐私保护技术(以区块链平台应用为例)
在大数据时代,数据存储方一般为云存储平台,与传统数据的拥有者自己存储数据不同,大数据的存储者和拥有者是分离的,云存储服务提供商并不能保证是完全可信的。用户的数据面临着被不可信的第三方偷窥或者篡改的风险。加密方法是解决该问题的传统思路,但是,由于大数据的查询、统计、分析和计算等操作也需要在云端进行,为传统加密技术带来了新的挑战。因此,本书选取了区块链平台应用场景为例,针对在区块链平台中存储的数据存在隐私泄露问题,第5章详细介绍了当前区块链隐私保护机制以及研究进展;并以电子健康记录数据为例,讨论了该场景下的区块链数据隐私保护方法实现过程以及相关实验结果。
(4)大数据隐私泄露的度量技术以及当前的治理机制
在大数据的环境下,如何确保合适的数据及属性能够在合适的时间和地点,给合适的用户访问和利用,是大数据访问和使用阶段面临的主要风险。为了解决大数据访问和使用时的隐私泄露问题,尽管数据生产者和搜集者使用各种方法来保护隐私,隐私泄露仍时有发生。因此,需要一种方法来度量隐私泄露带来的潜在风险,并针对隐私泄露造成的危害采取相应的法律治理手段来规范。因此,第2章介绍了隐私泄露风险的度量技术,第6章介绍了隐私危害的治理机制与法律监管技术。
1.6.2 本书的结构安排
本书的组织结构如下:
第1章,绪论。本章介绍了大数据时代隐私内涵的构成要素以及发展变迁历史,并从技术层面、社会层面、个人层面列举了大数据环境下隐私安全的表现形式,总结了当前个人隐私被侵害的类型以及呈现的特征;最后对本书基本内容和结构安排做简要说明。
第2章,隐私泄露风险评估与度量方法。本章讨论了大数据条件下隐私泄露风险评估方法以及目前的隐私保护方法,针对常用的隐私保护方法,详细介绍了隐私的量化模型与度量标准,并对常用的隐私度量方法进行分类总结,分析了目前主流的隐私度量方法的性能优劣以及评价指标。
第3章,位置服务中隐私保护技术。本章概述了基于位置服务系统组成、系统结构以及隐私的表现形式;针对实际路网条件的限制,对当前的位置隐私保护技术研究现状进行了回顾与分析;并给出了P2P结构与独立架构两种模式下位置隐私保护技术方案,详细介绍了两种模式下位置隐私保护方案的实验过程以及分析结果。
第4章,深度学习训练数据集隐私保护技术。本章概述了常用的深度学习模型,讨论了深度学习模型的弱点、存在的问题以及隐私窃取方式;针对差分隐私保护技术,详细介绍了该技术的理论基础以及和深度学习模型结合的研究进展;另外,本章还提出了两种差分隐私技术与深度学习模型结合的技术方案:基于DCGAN反馈的深度差分隐私保护方法和具有隐私上界的多分组深度差分隐私保护方法,详细描述了这两种技术方案的实现过程以及实验结果。
第5章,区块链数据隐私保护技术。本章对区块链相关概念以及技术进行了概述,并对存储在区块链中的数据风险以及隐私泄露问题进行了分析;针对区块链数据隐私风险,详细介绍了当前的区块链隐私保护机制以及研究进展;并以电子健康记录数据为例,讨论了该场景下的区块链数据隐私保护方法实现过程以及相关实验结果。
第6章,数据隐私治理机制与法律监管。本章详细介绍了当前数据隐私监管过程中存在的现实困境和监管挑战;阐述了各国对数据隐私监管采取的治理模式以及经验;结合我国的实际现状,介绍了我国对数据隐私保护的治理现状以及治理规则。