- 大数据时代个人隐私的分级保护研究
- 王敏
- 4064字
- 2025-04-08 17:49:57
第一节 大数据时代的隐私污染
一 全球性的隐私侵害
2015年12月16日,在浙江乌镇召开的第二届世界互联网大会开幕式上,中国国家主席习近平指出:“世界范围内,侵害个人隐私(的现象)时有发生,网络监听成为全球公害。”[1]这既是对互联网时代个人隐私安全的担忧,也是对网络监听、监控等侵犯隐私行为的谴责,还传递出政府治理互联网隐私的决心。
(一)国内外隐私信息遭到泄露现象成灾
随着信息技术变革的日新月异,互联网一方面极大地促进了人类文明的进步;另一方面由于规则不健全、秩序不合理,也给人类制造了新的世界性难题,个人的隐私权遭到侵犯便是其中之一。20世纪90年代,互联网实现广泛民用,个人隐私成为传播法制与伦理领域的关键议题,2013年6月,爱德华·斯诺登曝出美国“棱镜”项目,使之成为举世瞩目的焦点。尽管“棱镜门”对世界隐私信息安全格局产生了深远的影响,引起公众、学界和政府的警醒,但隐私信息遭到泄露的现象仍然层出不穷,相关报道呈现井喷之势(见表1.1)。
表1.1 2012~2016年国内重大网络隐私信息安全事件

表1.1 2012~2016年国内重大网络隐私信息安全事件-续表1

表1.1 2012~2016年国内重大网络隐私信息安全事件-续表2

2016年11月21日,中国青年政治学院互联网法治研究中心和封面智库联合发布国内首份《中国个人信息安全和隐私保护报告》。该报告披露,七成以上的人认为个人信息泄露问题严重。其中,多达81%的人接到过精准推销的陌生电话;53%的人因搜索网站、浏览网页而泄露个人信息,被某类广告持续骚扰;在租房、购房、购车、考试和升学等个人信息被泄露后,受到营销骚扰者高达36%;两成人曾受电信诈骗恐吓。但是,六成以上的人不知如何维权[2]。在此背景下,在校大学生因个人隐私信息被泄露而遭遇诈骗甚至酿就悲剧的事件层出不穷,2016年8~9月,接连发生的多起案例被集中曝光,引起社会各界的极大反响。其中,震惊全国的“徐玉玉案”更是入选“2017年推动法治进程十大案件”。“精准诈骗”是果,信息泄露是因。2017年全球十大信息泄露事件中涉及的国家数量和企业类型均较多,泄露的数据量动辄以数万条计(见表1.2)。
如果说以上均是典型个案,不足以说明隐私信息泄露的“新常态”,那么,2015年底360互联网安全中心发布的《2015年中国网站安全报告》则可从总体上揭示国内隐私信息泄密的现状和趋势。
表1.2 2017年全球十大信息泄露事件

该报告称,2015年,公司网站漏洞致使55亿条信息泄露(1~11月详情见图1.1),是2014年23.6亿条的一倍多。若以彼时中国网民总数为6.5亿计算,平均每个中国网民仅在2015年就泄露了8条以上个人隐私信息[3]。国内最大的漏洞修补平台补天平台称,40%以上的国内网站存在系统漏洞,必定在未来3~5年引发个人信息泄密事件数量呈几何级数增长。

图1.1 2015年1~11月隐私信息泄露量
资料来源:360互联网安全中心。
其中,IT/互联网、医疗卫生、电信运营、金融理财、汽车交通和教育培训六个行业泄露个人隐私信息的情况最为严重,在2015年共导致约11.5亿条个人隐私信息泄露。六大行业中IT/互联网行业情况最严重,约为5.23亿条。其后依次为医疗卫生、电信运营、金融理财、汽车交通和教育培训行业,泄露的个人隐私信息量分别为2.40亿条、1.97亿条、1.10亿条、0.54亿条和0.24亿条(见图1.2)。

图1.2 2015年六大行业隐私信息泄露情况
资料来源:360互联网安全中心。
不仅在中国隐私与个人信息侵犯现象泛滥成灾,在国外,包括欧美等注重隐私防护的西方发达国家,情况也丝毫不容乐观。通过综合《纽约时报》、《华盛顿邮报》、《卫报》、《连线》杂志、CNN、ABC、databreaches.net、pcworld. com等众多媒体和网站的报道、数据,笔者总结出2004年7月1日至2017年7月1日共13年国外100件规模最大的隐私信息泄露事件,按照隐私信息泄露的数量进行排名,同时分析其所属行业、泄密方式以及信息敏感度,得出以下结果(见表1.3)。
表1.3 2004~2017年国外100件规模最大的隐私信息泄露事件

表1.3 2004~2017年国外100件规模最大的隐私信息泄露事件-续表1

表1.3 2004~2017年国外100件规模最大的隐私信息泄露事件-续表2

表1.3 2004~2017年国外100件规模最大的隐私信息泄露事件-续表3

表1.3 2004~2017年国外100件规模最大的隐私信息泄露事件-续表4

如果以2004年7月1日[4]至2018年7月1日14年间有记录(能搜集到的相关报道约215件)的事件和数据为例,各行业中泄露隐私信息最多的为网络技术行业,涉及53.1亿人次;其次是医疗健康行业,涉及34.5亿人次,政府军队、金融理财和零售百货分别为33亿人次、26亿人次和13亿人次(见图1.3)。未来,随着大数据应用发展不断加快,如果不加以规制,这种业已泛滥成灾的个人隐私侵害现象可能还会愈演愈烈。

图1.3 2014年7月至2018年7月国外各行业隐私信息泄露规模对比
资料来源:综合外媒历年的数据泄露报道。
(二)大数据应用加剧隐私侵害
无论是国内还是国外,数亿条被泄密的个人信息都是数据的载体。数据是大数据时代最基本的单元,是大数据应用最有价值的元素。大数据应用即对数据的挖掘、收集、加工和处理的过程。在这个过程中,部分数据要么在网上流传,给当事人造成精神侵害;要么被转卖给一些公司进行市场营销,扰乱人们的生活;要么助力于人肉搜索,形成网络暴力;要么被不法分子用于网络诈骗,给人们带来精神与财产的损失;甚至被犯罪分子用于绑架、勒索,威胁到人们的人身安全;又或者被竞选团队用于宣传性新闻或诱导性观点的精准投放,左右大选结果。
2015年12月28日,美国CSO杂志新闻网站报道,信息安全学者克里斯·维客里(Chris Vickery)无意间在网上发现一个涉及全美50个州和特区,包含1.91亿名美国选民个人信息的大型数据库。该数据库完全公开,任何人都可自由下载。[5]数据涉及选民姓名、性别、家庭住址、邮寄地址、选举ID、电话号码、所属政党、详细选举史以及选举预期。这涉及技术伦理,是大数据应用的典型风险。一旦数据被泄露,必将导致大面积的隐私侵害,如扰乱私人空间、私人活动以及私人生活,引发电信诈骗、网络诈骗,甚至扰乱政治秩序。
2015年10月1日,美国《连线》杂志网站报道,黑客侵入信息服务公司益博睿(Experian)的内网,盗取了移动电话运营商T-Mobile 1500万名用户的隐私信息,并将数据发布到互联网上。[6]数据涉及用户姓名、家庭住址、出生日期、社会安全号、驾照ID号、护照号码以及用户附加信息等。网络技术公司和电信运营商直接掌握着大数据资源,而一旦它们被黑客入侵将导致数据泄露,这种非法知悉、搜集、复制、利用和公开个人隐私信息的行为,构成直接的隐私侵权。
2015年8月20日,《中国日报》中文网报道,加拿大偷情网站“阿什利·麦迪逊”被黑客攻击,3200万名用户信息遭泄密,涉及用户姓名、个人相片、信用卡号码、电子邮件、个人地址、聊天消息、电邮内容,以及性爱偏好、偷情记录等。私人调查公司通过帮助他人搜索这些信息大赚一笔。网站名声遭到毁灭性打击,许多用户及其家庭陷入纠纷或危机,甚至有资深警官为此自杀。[7]注册用户数据库是大数据的一大来源,一旦其被泄密、利用,将给用户带来直接伤害。而这种涉及性爱偏好、偷情记录的敏感信息,一旦被公开和利用,其对个人声誉造成的损害以及带来的社会负面影响非同一般。与之类似的案例是俄罗斯约会网站Topface信息被盗事件。新浪网2015年1月26日报道,Topface 网络系统中,2000多万名来自俄罗斯和欧盟的注册用户的个人信息被盗,涉及银行资料、病例记录及其他敏感数据信息。[8]
2015年7月16日,新华网报道,一名越南黑客于2007~2013年侵入美国多家企业电脑,窃取约2亿美国人的个人信息,涉及SSN(社保账号)、银行账户、信用卡信息和家庭住址等,并将其发布于自己运营的网站,获利超200万美元。[9]2亿人为美国总人口的三分之二,其信息是一个超大型的数据库。非法获取、公开该数据库并借此获利,是一种直接侵权行为。与之类似的案例是美国第二大医疗保险公司Anthem的数据库失窃事件。据人民网报道,2015年2月6日,Anthem的数据库遭黑客入侵,8000万名用户个人信息被泄露,涉及姓名、出生日期、SSN号、家庭地址、受雇公司信息等。[10]
以上为2015年大数据应用侵害隐私的典型案例,其影响广泛而深远,并且,凭借个人隐私数据获利的案例越来越多,增长趋势越来越明显。2014年最知名的隐私侵害事件是以下四个:俄罗斯黑客团伙盗取12亿条网络验证信息事件、苹果手机iCloud云系统漏洞导致的好莱坞艳照事件、摩根大通数据库被黑以及索尼影业的机密数据被盗事件(见表1.4)。
表1.4 2014年大数据应用导致的四大隐私侵害事件

影响最为深远的当数2013年6月6日英国《卫报》和美国《华盛顿邮报》首度曝光的“棱镜门”事件[11],其牵涉面最为广泛,监控内容最为庞杂,性质最具争议,连锁反应最为强烈,既重创美国中央情报局,又引起世界各国的警惕;既引发众怒,也唤醒一部分人的隐私保护意识,使其认识到在大数据浪潮势不可当的时候更应注重个人隐私保护。
但是,大数据时代的数据泄露与隐私侵害已经超出个人防护与政府规定的范畴。最为典型的是2018年3月曝出的Facebook数据泄露丑闻。早在2013年,剑桥大学的研究人员亚历山大·科根(Aleksandr Kogan)就在Facebook上开发了一款性格测试应用软件——“This Is Your Digital Life”,并通过随机发放2~5美元红包的方式大力推广,获得27万个用户。由于用户均授权该应用获取Facebook社交关系及好友信息,科根间接获得了近5000万人的数据[12]。2016年美国大选期间,这些数据被一家名为“剑桥分析”(Cambridge Analytica)的大数据政治咨询公司用于向选民精准投放新闻、观点或宣传材料,从而改变选民行为,最终影响大选走势,帮助了特朗普竞选团队。“剑桥分析”公司正是由特朗普的总统顾问、白宫首席策略师史蒂夫·班农创立的,该公司除了干预2016年美国大选,还直接参与英国脱欧事件以及尼日利亚、肯尼亚、捷克、印度、阿根廷等国的政府大选事件[13]。这些事件被“剑桥分析”的另一位创始人曝光后,社交帝国Facebook被推上舆论的风口浪尖,股价大跌,甚至到了生死存亡之际[14]。Facebook这类开放性社交平台将其拥有的海量用户数据及关系数据通过Open API开放给第三方开发者,一方面令全样本的数据流动起来,经由第三方进行数据挖掘和分析,并以数据产品的方式推回给用户;另一方面也削弱了平台对数据的控制力度和保护力度。在这种情况下,个人隐私数据势必会被滥用,数据泄露状况让社交平台也束手无策。在保持平台、数据开放性的同时,强化对数据的治理、隐私的保护,成为大数据时代一个值得深入思考和探究的重大理论与现实命题。