在过去的5年里,一种隐私保护数据分析的新方法已经奏效了。这个方法不同于大量在统计数字、数据库、理论和密码社区领域的相关文献,因为,一种正式的针对所有的隐私保护已经被界定,并且证明了展示的数据分析技术能够满足这种保证。出现的关键隐私保护就是微分隐私。(出自:Differential Privacy: A Survey of Results. http://research.microsoft.com/apps/pubs/default.aspx?id=74339 )那么,什么是微分隐私?下面的例子会使我们对其产生一定的初步认识。
有传言称,我们的个人信息将价值1000亿美元。因为,脸谱网站有望于2012年上市,其首次公开募股(IPO)将价值上千亿美元,所有这一切都要归功于你我。
按照这一市价,脸谱网站8亿左右用户的人均价值约为125美元。但是,为什么脸谱网站能够将你的私人信息等类似内容卖给广告商,难道你不能从中分一杯羹吗?
遗憾的是,我们不能。我们的信息只有在成为一个庞大群体的一部分时才有价值,只知道你一个人更喜欢番茄酱还是芥末酱对企业来说毫无价值,但是,从数百万人身上收集到的同样信息,对麦当劳来说就不啻为一笔财富了。
当然,如果你决定独自出售你的私人信息,那么,你需要知道它的价值。一种找到价值的方式是发现其微分隐私,这个数学框架等于信息的价值除以没有这条信息可能会带来的伤害。伤害可能包括接到市场推销电话的机会、被保险机构拒绝的风险或者仅仅是朋友很少想起你。
不过,只有当你知道你的隐私数据如何被处理时,微分隐私才起作用,而社交网络对如何处理你的隐私信息并不透明。因此,只有脸谱用户非常愿意免费透露他们的数据,我们才能将私人数据真正变成实实在在的钞票。
微分隐私存在的目的就是提供最大化统计数字数据库查询精确性的同时,最小化识别个人隐私记录的几率。
王英 供稿 刘静编辑
转自:http://www.stdaily.com/stdaily/content/2012-01/22/content_418132_3.htm