今日中国


大数据与小隐私


2013-07-15 17:31:52     作者: 马 迪    字号: T|T    来源:

似乎所有政府部门的临时工都习惯惹事儿。

最近,因为一位“临时工”爱德华·斯诺登的爆料,美国政府摊上了大事。一个代号为“棱镜”的秘密项目在过去6年间,从多家知名互联网公司获取电子邮件、在线聊天内容、照片、文档、视频等网络私人数据,用以监控恐怖主义犯罪活动。

获取海量数据,利用信息分析技术找出具有相关关系的因素,为行动提供指导,这是典型的大数据应用,但这个过程中却隐藏着魔鬼——那就是数据的所有权和隐私权的保护问题。

数据多≠大数据

数据其实是一座“金矿”。绝大多数人都没有意识到自己每天制造了多少数据,以及对数据的利用已经发展到了怎样的地步。

举个最简单的例子,人们到超市买东西,结账时会收到一张购物小票,包含当次购买的所有商品信息。你也许会随手将它丢弃,但像沃尔玛这样的全球连锁超市巨头却不会放过这些蛛丝马迹。

通过对数以亿计的购物清单进行分析,商家就可以推断出当地当季,什么商品和什么商品摆在一起最好卖。在一般人看来,尿不湿和啤酒实在没什么共同处,但大量数据显示它们其实是一对“好搭档”——年轻的爸爸在买尿不湿时,常常会忍不住买点啤酒犒劳自己。

这种精准营销,得益于利用数据的合理分析。这个过程堪比“淘金”——在琐碎而庞大的数据库中“挖掘”、“筛选”和“提炼”,最终得出意想不到的结论。

这种做法由来已久,跟如今炙手可热的“大数据”有什么不同呢?数据累积得多了,就可以叫“大数据”吗?

所谓大数据,不单单是指数量庞大,还在于其种类繁多、产生快而更新更快。它不仅来自于特定领域,也产生于我们每天的日常生活中。大数据的爆发要归功于社交网络、电子商务和物联网的快速发展。以前,人们只是将上网当作一种娱乐方式,而现在,人们更多地“生活”在网络平台上。互联网上的数据洪流正在呈现几何级增长之势,每18个月就会翻一番。

所以,真正的大数据,是从不同维度、不同途径获取的各种格式的数据碎片之和,它包含且不限于文字、图片、视频、声音、位置——可以说,它包罗万象。

大数据能做什么

世界正在进入一个“大数据”时代。数据规模越大,处理的难度也越大,但对其进行挖掘可能得到的价值更大,这就是大数据热的原因。

全世界的搜索记录、网页浏览记录、社交关系、购物清单、阅读书目、行车记录、旅游经历、医疗记录……不同维度的数据放在一起分析,得出的结果才更真实准确。大数据挖掘的重点对象之一,就是人的行为规律。

虽然我们总以为自己是基于经验和直觉而做出种种行为,但放在全人类范围里,你会发现自己并没有那么与众不同。也就是说,基于数据和分析,每个人的决策在很大程度上都是可以被预测的。(你百思不得其解,为什么豆瓣网个人主页上的推荐总是那么对你的胃口?其实就是这个道理。)

商人们率先从中看到了商业价值。他们将客户的个人信息与行为特征结合起来,预测客户需求,以提供更有针对性的个性化服务。比起被淹没在海量信息中且被迫要做出选择,能轻松地享受个性化服务确实不错。大数据时代,商家可能比亲人朋友更懂你,甚至能够预测出你接下来可能要做什么。

这真是一幅既美好又可怕的前景。

这种技术的前沿领域还演变出一种人工智能,即让计算机以类似人类的方式来学习。用户提供的数据越多,计算机就越能预测用户想要什么,例如:在你拼错字的时候猜测到你实际想搜索的关键词。计算机的“大脑”在大数据的支持下,会越来越聪明。

匿名的隐私

“大数据”概念从诞生起便伴随着巨大的争议。不论是企业还是个人,都会因为大数据的爆发而获益匪浅,但同时,个人隐私也无处遁形。毫无疑问,它是一把双刃剑。

当你在网上登记自己的个人信息时,无形中就是把隐私托付给了陌生人;视频监控带来安全感的同时,别忘了你也是被监控的一分子;你用手机通话时,运营商不仅知道你打给谁,打了多久,还知道你是在哪里进行的通话……

以前,这些记录几乎不会对普通人造成影响,因为它的数量如此巨大——我们把自己隐藏在茫茫人海中,以获得一定程度上的安全感。但是,随着大数据技术的不断进步,对某个个体的行为进行放大分析,越来越容易了。这也就是为什么“棱镜门”扰动全球的原因。

大数据的发展潮流如此势不可挡,被裹挟于其中的人们只能妥协,接受匿名的隐私泄露。但在过去的几年中,计算机专家一再表示,即使是匿名的数据也可以被重新定位,归属到具体个人身上。

哈佛大学教授斯威尼的研究显示,只要知道年龄、性别和邮编,并与公开的数据库交叉对比,便可识别出87%的人的身份。这意味着人们隐私权的最后一道防线同样脆弱得不堪一击。

很多人已经意识到,制定数据应用的相关法律法规已经刻不容缓。作为用户,我们需要明确界定自己在数据的使用方面具有什么权利和义务;作为企业和政府,需要法律的清晰规定其可以在多大程度上、用什么样的方式来使用用户的数据。总之,不应假定消费者在使用产品时如主动透露了自己的隐私,就意味他们授权企业使用这些隐私。

“棱镜计划”在水下进行了6年。大数据时代早已拉开序幕,是时候构建一张更完善的安全网了。

在线订阅

在线试读 杂志订阅

今日中国 2013-12

中国改革进入深水区,2013年11月召开的十八届三中全会,对中国全面深化改革做出了总体部署,明确提出到2020年改革要取得决定性成果,形成更加成熟定型的制度体系。

微博互动