Who Knows You Better

Fred

2019 年 6 月 13 日

IPFS

剛剛看完《黑鏡》第五季第五季第二集，關於一個大型社交媒體公司: 「Smithereens」（碎片）講的是倫敦一個拼車司機綁架了社交媒體互聯網公司的一個員工，引發了一場國際危機。

爲什麼單獨拎出來這一集，是因爲這個這一集對於事件的演繹太貼近自己接觸到的現實情況了，尤其一些關於技術與社會的演繹非常的深刻。

羣體數據與個體數據

個體數據

這一集有一個地方印象非常深刻，是警方和碎片的 COO 去了解 Chris 背景信息維度的差異。

警方想要了解的信息有 Chris 有沒有犯罪前科、之前的工作是什麼、親人以及居住情況。但是碎片公司瞭解到事件之後，直接在後臺的用戶分析界面看到 Chris 的數據：包括歷史的工作、給他打的用戶標籤（高智商低收入）、登錄行爲、使用的關鍵詞的雲圖、平臺的活躍情況，同時瞭解到司機之前的接單歷史（並且確認司機是冒用身份），判斷出是有目的地綁架公司員工，基於歷史帖子之前的事故以及主人公的心理狀態。

互聯網公司記錄用戶數據已經成爲行業慣例，但是對於用戶數據的使用大部分人其實有很多誤解。有些維度過度揣測，還有一些維度未曾考慮到。

政府對於民衆的監控之前主要是監控“離散的關鍵節點”，比如房產登記、犯罪記錄、貸款歷史這種。連續的信息對於政府是比較難去記錄的，比如心理狀態、情感狀態、思維方式的改變。而大家長時間的在手機上面的操作行爲，卻能很好地反應這種線性的變化。

值得慶幸的是，目前互聯網公司對於個體的數據分析(挖掘)程度還是比較低，比較深入的應用只不過是精準營銷，用戶標籤體系。針對個人的分析性的項目的應用場景還是比較窄。但是，隨着頭部應用和公司的增量放緩，精細化的數據分析是必然趨勢，長期來看有必要對於相關數據權利進行探討。

羣體數據

之前實習的時候在做 A/B Test 時候，看到有人感慨自己所掌握的試驗資源，覺得不認真分析就是浪費。在億級別的用戶裏面做 AB ，只用 10% 的流量就是千萬級別，這是在學校裏面幾乎獲取不到的樣本量。在設計好實驗條件的情況下，結果的置信度也要高很多，也更加精準。

目前互聯網公司對於用戶的分析還是主要和和淺層次的產品需求掛鉤的，比如用戶點擊行爲和 UI 樣式的關係。在這種程度的分析情境下，其實對於個人的隱私入侵可以忽略不計，但是如果代入另一個場景：

每天早上家裏的設備都是由智能助理輔助操作的，比如 Google Home 在你醒來時自動開燈，開窗···
你的出行行爲與地圖和汽車的定位數據綁定
你想要吃什麼在點評類 APP 詳細記錄
應酬等邀約通過日曆工具記錄

在這種場景下，即基於羣體性的結果針對個體進行應用的情況，更容易針對性地對一個人分析。因爲應用羣體性結果的前提條件就是個人的分析數據的結果，類似的各個維度的分析結果可以詳細地拼湊出完整的用戶畫像，針對性地對用戶行爲進行預測也容易得多。

以上這些基本上都已經成爲現實，可以說如果能夠將這些數據打通，你的會“行爲數據”比你更懂你。從好的維度來看：

你新到一個城市，你的語音助手自動給你推薦當地美食，根據你的消費水平預訂酒店。
在朋友生日自動幫你給朋友郵寄對方喜歡的禮物，你只需給助手回覆一下“確認”。

同樣，也可能會有下面情況：

有一天你在答辯的時候，有人針對你 10 年前的一條微博提出不符合價值觀的質疑。
你的個人手機號在某個網頁上被搜索引擎收錄，同時被爬蟲記錄並歸檔到對應的人羣進行廣告推薦。
社交媒體通過內容推薦機制，影響公衆的輿論走向以及政治傾向。

我們很難去要求商業公司依照道德準則去使用用戶數據，我們更多的應該從立法以及行業規範來約束個人數據的使用以及分析。類似智能家居，智能手機能接觸到的敏感數據的量是難以想象的，但是大部分公司因爲業務相關性的原因沒有去深入挖掘這些數據的應用場景，也沒有意識去防範這部分數據被濫用。一旦從某種渠道讓別有用心的人獲取，類似數據將帶來的風險性是巨大的。

Tech Makes Who you are

每個人與外界的關係是相互的，自己在改變外界的情況的情況下，也被外界改變。劍橋事件還僅僅是通過廣告來嘗試影響政治選舉，畢竟有明確的 AD Load 擺在那，他們能夠操控的信息流只是一少部分。更讓人擔心的是類似在美國大選期間，Google 等公司通過修改搜索引擎關鍵詞提示來影響人們的主觀判斷，爲希拉里拉票。最近幾年其實互聯網公司或多或少都意識到了自己影響整體輿論走向的能力，比如飯否事件，#MeToo 運動，這些事件的傳播都在造就當下大家宏觀的價值體系。

很慶幸的是目前頭部的互聯網 or 社交媒體公司有比較“正確”的價值觀，但是這就像讓一個 5 歲的孩子拿着控制核武器的按鈕。在沒有惡意的情況下大部分情況都是安全的，但是很難確保長期的無害。比如有不可控因素影響這些公司，如政府通過強制性的法律 or 行業規範介入公司的在線業務？或者某些惡意公司通過收購獲取其他公司的業務？

God Mode

這個是在看到一篇臺灣的文檔覺得合適“拿”過來的標題，當你有全域的數據訪問權限的時候，那種感覺有點像你在 GTA 裏面輸入了一段 cheat codes。只不過現實中你是輸入的一串 SQL，你就能查到某個用戶的所有數據，比如出行記錄，酒店預訂記錄，打車記錄等等。曾經“有幸”在簽了足夠的保密條款後，獲得過類似的權限，很難忘記第一次查詢數據的時候驚訝於事無鉅細的用戶行爲記錄。

尤其是在在線廣告將跨平臺的數據打通之後，用戶 ID 在不同 APP 和公司之間可以直接轉換，連帶的用戶數據也一併被打通。倘若完全地進行數據共享，對應用戶的畫像可以精細到難以置信的地步。

科技排毒

說實話這是一個很魔幻的但又是現實的場景，比如2018年7月初，Marc Benioff (Salesforce CEO) 將他的 iPhone 和 iPad 裝入FedEx 信封並郵寄到夏威夷的避暑別墅。他隨後乘坐飛機離開舊金山，在加拉帕戈斯羣島，波拉波拉島和復活節島度過了一個安靜的兩週假期。並且1月達沃斯世界經濟論壇期間，公開職責 Facebook，稱其與菸草一樣令人上癮。

有一種說法是在存量用戶到頭的時候，大家競爭的是用戶的使用時間。在這個既定目標之下，不同的應用必然會變得更加上癮，高度集中的刺激性內容會極大地提升用戶的 “High 點”，從而對其他事物降低興趣，潛在地影響用戶羣體的正常生活。在通過在線廣告的盈利模式下面，這種閉環連接地會更加緊密，比如在信息流產品裏面，AD load 一定的情況下，用戶使用時間越長，瀏覽的內容越多，瀏覽的廣告也就越多，互聯網公司的經濟收益也越多。從某種角度，這也是一種“免費的是最貴的”的體現。

Right to be forgotten

Right to be forgotten 是一種在歐盟內部存在的人權概念。簡而言之，即人們有權利要求移除有關於自己的負面信息或過時的個人身份資訊搜尋結果；但因爲產生了與言論自由間的衝突，與可能產生互聯網審查的疑慮，因此引發了爭議，且法律框架仍不明確，當前只有在歐盟實行。

因隱私權問題而從 Google 搜索結果中移除網址: https://transparencyreport.google.com/eu-privacy/overview

來自個人博客，也許文章不定期會更新

CC BY-NC-ND 2.0 授权

喜欢我的作品吗？别忘了给予支持与赞赏，让我知道在创作的路上有你陪伴，一起延续这份热忱！

Fred一個搭平臺的人