对隐私问题的探讨,要远远早于计算机技术的出现,更远远早于大数据技术的出现。只是因为在计算机和大数据的应用过程中,包含有个体隐私和安全的信息以数字化的形式存储在各种网络终端中,并通过网络进行广泛的传播,才使得数据隐私问题越来越严重。
在通常情况下,人们都会有意识地将自己的行为隐藏起来,试图达到隐私保护的目的。但是互联网特别是定位技术和社交网络的出现,使得人们在不同地点产生越来越多的数据足迹,同时更改变着人们的社交方式和对待隐私的态度,使得一部分人愿意在社交网络上主动曝光自己的行踪和部分隐私。而在一般情况下,单个地点的信息很难直接暴露出用户的隐私,但是如果将单体的数据在空间和时间上进行累积,并形成有规律的“踪迹”,他的隐私就很可能会暴露,而这种隐性数据的暴露往往是超过个体的理性范畴和经验范畴的。
从技术层面来说,可以通过数据抽取和集成来实现用户隐私的获取,而正是这种对数据累积性和关联性的挖掘,恰恰是大数据技术最具有商业开发价值的一面。举例来说,现实中通过“人肉搜索”的方式往往能更快速、准确地得到结果,这种人肉搜索的方式实质就是众包(crowdsourcing)。因此,大数据时代的隐私保护面临着技术和人力层面的双重考验。
另一方面,如果仅仅为了保护隐私就将所有的数据都加以隐藏,那么数据的价值就无法实现。因此对于特定的数据进行公开是必须的,政府可以从公开的数据中来了解整个国民经济和社会的运行,提供更好的公共服务。企业则可以从公开的数据中了解客户的行为,最大化其利益。研究者则可以利用公开的数据,从社会、经济、技术等不同的角度来进行研究,促进社会的文明与进步。
所以对大数据时代下的隐私保护表现为,在不暴露用户敏感信息的前提下进行有效的数据挖掘,这是与传统的信息安全领域的理解有着本质性差别。而现在已有的大数据的隐私和安全保护主要集中于研究新型的数据发布技术,尝试在尽可能少损失数据信息的过程中,实现对用户隐私的最大化隐藏。但由于在数据信息量和隐私程度之间存在着先天性的对立,在技术领域,还没能出现最为有效的解决办法。不过令人振奋的是,随着研究人员的努力,在2006年Dwork提出了新的差分隐私方法。这种技术可能正是解决大数据中隐私保护问题的一个可能的方向。
此外,传统的对隐私信息和数据进行加密的安全保护措施,受到了大数据时代的挑战。现有隐私保护技术主要基于静态数据集,而在现实中数据模式和数据内容时刻都在发生着变化。因此在这种更加复杂的环境下实现对动态数据的利用和隐私保护将更具挑战。
同时,在大数据的和网络的接入终端方面,移动终端的迅速普及,使得手持设备已经超过了传统计算机的销售数量,并最终会成为大数据时代的主流终端。而这种变化,对于传统的隐私保护提出了观念上的挑战。如果说前两项挑战是针对技术的,那么后一种挑战,则是一种制度、文化层面的挑战。
在人类关系社会当中,出现了数字化和移动设备的异化,这会从根本上改变人类的生活方式和生产方式。这种改变具有深刻的社会意义:当移动性成为生活的核心成分,使得人们的消费方式由传统的对物质稀缺的消费转变为对生命和时间稀缺的精神消费。
手持设备成为社交中关键性的沟通工具和中介,使得人们的生活行为被异化到了工具之上,甚至会出现某种程度的“工具理性”。最终会带来人类生产行为方式的改变,例如对于安装了各种传感器的手机来说,它已经由通信工具转化为娱乐中心,再提升为高效率的生产工具。
而这种改变的出现,正是大数据进行科学的隐私行为研究的一种现实基础。并且在研究领域中形成了新兴的学科与研究领域,或许可以称为“大数据视角的行为科学”。通过把大规模的移动数据作为输入,可以界定和理解真实的生活现象,比如个人特质、人的移动性、沟通和互动的模式等等。最终形成针对个体行为的一种真实还原,而不再是传统的计算科学中的模拟建模过程。这也正是笔者和研究团队一直强调和深入研究的大数据的哲学基础——离散主义的一种具体应用。
通过大数据的移动计算技术,可以将用户常去的场所赋予某种定义,再加上用户的智能手机所感知的其他情境信息,有可能催生出许多新的服务需求。而不同的定义就需要不同类别的数据进行支持,例如,地理位置与光顾次数哪个更重要?由此,可以根据光顾次数而构造某种定制化的媒体或者广告?更进一步说,有没有可能预测用户下一步要去的地方?预测用户的位置,对于推荐系统和情境感应型的应用堪称关键。有许多推荐是基于位置的;预计群体的移动趋势也有重大意义。根据用户的当下情境,预测他的未来去处,这需要根据用户的移动历史建立特定的用户模型,然后再把这些模型应用于当下情境中。最终,互动不会终止于人与机器,会有更多的互动发生在数字化物体之间,这就是所谓的“物联网”,也可以说,人机互动加上物物互动,会形成一个“万有网”。
这就是离散主义下的数据+网络+平台的一种人类社会结构。而其中对以隐私权为内核的数据产权的合理保护,则是构成这一切的基石。正像私有产权严格保护带来了今天世界经济的繁荣一样重要。
大数据技术的出现,将整个人类社会都变成了一个巨大的实验室,每一个人类的个体行为和去体检的互动,都可以进行数字化的表达。并通过不同类别、来源性质的进行各种价值上的关联,在形成海量数据的同时,更还原了我们人类真实的生活场景和生活方式,这是一种可以令人振奋的描述,但是,另一方面这又会令人觉得恐怖:我们的隐私和秘密将无处安放。但这种描述正在逐步地变为现实。
所以,对于大数据隐私和安全问题的研究和讨论,不单是一个技术问题,也不仅仅局限于一个权力、制度或文化的问题,这更是对人类在存在方式的一种认知问题。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。