从广告和数据,看Facebook泄密到底是怎么回事?
我老公杰米是个几乎不看新闻的人,每次只在测试网络连接的时候在地址栏搜Trump,大略扫过两条最新新闻。
所以Cambridge Analytica事件爆发,我很意外他居然已经听说了这件事。
“俄罗斯黑客呗,”他说,“这不就是又一次黑客攻击吗?”
“拜托!你自己还是又做数据又编程,怎么读完新闻还这么外行!”
杰米现在在一个computational biology的PhD项目,他实验处理数据的难度和量级比我做media campaign大多了。
“我就看了个大概,他们从Facebook上获取了五千万用户的数据,然后就影响了大选。”
“你看你这复述已经不能再粗糙了!你是想说获取数据是黑客吗,光是数据怎么影响大选?”
杰米耸耸肩,“不知道啊,可能这五千万人都有什么国家机密吧。”
“怎么可能!你觉得像你我一样的普通人能有什么机密。”
“那这到底是怎么回事?”杰米把问题抛回给我。
我看着他说,“其实他们在做的事情跟我的工作可能是非常相似的。”
杰米自认是科学家,仿佛有纷扰世事的豁免权。我们俩的事业发展完全是两个不同的宇宙。他对我所在行业和工种的了解,就只是说出我在媒介公司做数据化媒介交易(programmatic media trading)。具体要他说细节,他就只能摇头。
“我跟你说过我的工作是数字广告的精准投放。精准投放的目标呢,是让广告在对的时间,对的地点和对的设备,出现在对的人面前。”
“那么我们这些人怎么会知道什么是‘对的’呢?就要靠各种各样的数据。比如我们合作的某个机顶盒公司,他们有很多的用户帐号,这些用户帐号里会有地址,以及付费订阅使用的信用卡;而另一个公司呢,他们可能是专门给百货公司提供合作信用卡的,这个信用卡公司会有一些消费行为的归类,比如你什么时候去做汽车保养啦,通过你的消费金额和频次来判断你的车龄和车况等等。这就是为什么我跟你说我的工作可能有点诡异(creepy)的原因。”
“我们确实有这些数据,但是因为数据监管,我们不会直接知道这个人姓甚名谁。但是因为数据块(data segments)很多,而且可能相互交叉,我们可以把这些信息全部重新匹配到我们的更大的用户和设备库里(audience management center),然后形成我们运行campaign所需的投放数据(data targeting)。”
“通过市场调研,我们知道我们要影响的人是谁;通过各种数据供应商,我们获得接触他们的方式。作为交易员,我们开始在平台上建立campaign,对这些人投放有影响力的广告。比如我,一个25岁以下生活在纽约的亚裔女青年,好多广告主都对我感兴趣,比如JCrew还有Apple。他们就会对出现在我面前的机会竞价,让我在不同的时间,地点,设备看见JCrew的打折信息,Apple的新手机。因为他们知道我这样的人,是最有可能买衣服买手机的。”
“这跟Facebook的大新闻有什么关系?”
“这么明显你还看不出来!”
“Facebook这次的事件是一次数据泄露(data breach)。当时Facebook的数据分享API还非常不完善,用户授权某个API,他们不知道自己可能泄露了‘太多’的讯息。当时是剑桥大学一个研究员Aleksandr Kogan做了一个问卷,有27万Facebook用户参与。这些用户首先不知道自己到底授权了哪些项目,然后也不知道这次参与同时牵涉了他们的整个Facebook朋友圈。”
“这些‘授权’的数据很多都是非常个人化的信息(personal identifiable information),而不是我们在做广告的似乎后用的Non-PII数据(non-personal identifiable informationl),所以可能变得非常危险,可怕地‘有效’。”
“他们授权的信息包括你最近去了哪,你‘like’了哪些内容,和你的宗教信仰政治偏好。这就是我们当年注册Facebook时一股脑填的信息。更可怕的是,因为这个API的漏洞,你所有好友的这些信息也就被分享出去了。因此二十七万人做了问卷,但五千万人的信息泄露。”
“而这些信息,落到了俄罗斯人手上,用于支持Trump campaign,就变成了大祸害。”
“比如你本来只是不喜欢希拉里,因为她玩纸牌屋那一套的政治手段。你可能还不觉得她是个坏人,只是觉得她是个政治动物。但是,因为Trump campaign知道了这些内容,他们因为你转发的《纽约时报》对‘邮件门’的报道而判断你可能是一个可以‘被做思想的同志’,然后就开始给你看一系列针对希拉里的假新闻。比如她在DC的披萨店养童妓,比如她在纽约参加活动的时候昏倒是因为她得了绝症,比如她可能是个蜥蜴人。”
“你一开始可能还不相信这些内容,毕竟真的太扯了。但是这些推广内容出现在了你的Facebook时间线上,你会觉得不妨一读呗,反正不碍事。然后读完了你可能会想,这个简直胡扯,但万一是真的呢,于是分享到了你的朋友圈。同时你的朋友,被另外一条假新闻的推广信息轰炸,又看到了你,作为熟人,分享了这么一条新闻。在这样环绕声的影响下,你可能潜移默化就被敌人‘感化’了。”
杰米目瞪口呆。
“我跟他们做的事情手段可能是类似的,利用数据找到相关的人,然后希望影响他们产生购买或者其他行为。但我们做广告的,手脚几乎是完全绑住的。尤其现在欧盟又出了一个GDRP的新数据监管条例,我们能产生的影响/危害远远不会这么大。”
杰米总结:“还好我每次上网都是隐身模式的(incognito mode),而且永远都用很复杂的密码,同时在每次用了学校的电脑以后会清理cookies。”
“恩…我知道所有的这些,但我的上网行为还是很不kosher,还是暴露太多个人信息哈哈!”
“对啊!你每去哪都各种check-in还发照片,无语了!民主的最大威胁就是自拍了。”
“哈哈哈哈!”