大數據時代,讓數據說話
書名:《大數據》
作者:麥爾荀伯格、庫基耶
譯者:林俊宏
出版社:遠見天下文化
出版日期:2015年12月
電腦在半世紀前進入主流社會以來,所累積的資料量已達到相當龐大的程度。現在世界上不僅是資訊量前所未見,資訊成長的速度更是一日千里。隨着網絡的普及和雲端運算的急速發展,巨量資料的取得與分析為我們帶來新的思維,顛覆了許多領域的理解與運作模式,從科學、醫療、經濟、教育、政府、到個人社交生活等各方面皆是如此。
在《大數據》一書中,作者告訴我們巨量資料掀起了人類在生活、工作和思考方式的全面革新。它一方面協助我們用新的方式來了解世界,改善我們決策的方式,但與此同時,也帶給我們一些新的挑戰和危機。然而只要我們能夠看清巨量資料的重要性,懂得巧妙運用蒐集得來的資料,掌握如何利用它的威力,而不是被它掌控,就能從數據資料中發掘到許多意想不到的秘密,從而創造出新的價值。
巨量資料所指的,是一定要達到相當規模才能做的事(例如得到新觀點、創造新價值),沒有一定規模就無法實現,而且這些事將會改變現有市場、組織、公民與政府間等關係。
作者首先提出了大數據時代對思維所產生的三大改變。第一,是要有針對特定主題分析龐大資料整體的能力。隨着科技的進步,蒐集資料的技術日趨成熟,我們已擁有全部或至少盡量完整的資料,也就是接近“樣本=母體”的境界,故此不應再使用抽樣的方法去操作資料。第二是要擁抱雜亂。接受資料是雜亂的,無法精確的,這是一種取捨:放寬允許的誤差值,手中就能有更多的資料。雖然資料愈多出錯機率就愈高,不過,卻因為結合了不同源頭、類型、格式的資料,因而換得更多回報資料,可以讓我們看到更廣、更接近事實的全貌。因此,與其要求完全精確,倒不如與雜亂共存,這反而能讓我們更往真實接近一大步。第三個改變,是相關性。正因為我們願意讓更多資料不需追求絕對的精確,於是看待事物也有了新的方式,會嘗試從資料中找出可能性,從相關性的角度掌握先機,而不是如從前般要在有限資料中追求因果關係。書中舉了Google於2009年靠民眾搜尋關鍵字,預測出流感蔓延的例子,比美國政府更快更準確地掌握到流感傳染的即時資訊,有效協助當局控制疫情。
事實上,資料就是經濟學家所謂的非競爭性商品:某個人的使用並不妨礙他人的使用,而且使用後,也不會像物質性商品一樣有損耗。因此,Amazon不只用過去的交易記錄,來向使用者提出購買推薦,還能夠一用再用,用到其他客戶身上。這意味着企業取得資料後,即使第一次或後續每次使用都只得到少量價值,但只要不斷重複使用資料,就能做到有效而充分的利用。以往一旦資料完成原始用途,我們就會認為它已經完成目的,似乎所有關鍵價值都已釋放完畢,可以放手刪除。但現在資料就像一座神奇的鑽石礦,就算已取得主要價值,還是能不斷繼續開採,可不斷延伸應用,釋放其選項價值,獲得更大利益。書中舉了不少實例證明資料的價值在於使用,而非單純佔有。某些創新企業就是看穿了這一點,從無用的材料中取得資訊,經過分析資料來預測趨勢,將舊有資料轉化成新資訊,挖掘出資料的隱藏價值。
最後,書中也探討了巨量資料的黑暗面,首當其衝是對隱私權的侵害。今天每個人都在不知不覺中被蒐集了個人資料和受到監控。而由於預測能力愈來愈高,使得我們依賴資料分析來做各種預測,甚至靠預測來預防犯罪,這卻可能會因對他人行為妄下判斷,導致誤判犯罪情況的發生。作者提醒我們,巨量資料只是工具,雖然數據會說話,但它只僅供參考,運用時別忘了要謙卑、注意道德及人性化的一面,因為科技始終來自於人性。
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!
- 来自作者
- 相关推荐