《數據之巔:大數據革命,歷史、現實與未來》讀後感
如果你同我一樣對數據嘅由來冇乜概念而又想知道數據嘅小小歷史,現在同未來嘅方向,推薦你睇。
本書分為兩大部分,上部為小數據分三個時代(初數、內戰、鍍金)用五章剖釋,主線跟美國時序走時間有始有終;下部為大數據分四大時代(量化、抽樣、開放、大數據)用三章講解,而因為依四時代仍然延續緊所以作者只標示出重點事件,冇劃分終點。(抄考導讀)
一開始就用美國立憲嗰排嘅歷史嚟帶入主題,因為當時要設立憲法解決政治體制同權力配置嘅問題,聽起嚟同數據冇關係,但當時嘅美國嘅建國者喺兩者之間搵到關聯:要數人頭。佢哋認為多數人嘅意見雖然代表着多數人嘅利益,但大多數根本就係平庸嘅多數,人類嘅精英永遠都係少數嘅,民主唔可以保證人類社會向正確方向發展,最終就確立咗之後嘅方向:「制憲會議逐漸達成了共識:民主只是基礎,共和才是目標。」(共和:強調如何杜絕[多數人暴政],保證因為「民主社會分裂的多數人和少數人」能和諧共處)。
而點樣去令每個州唔會因為權力而偽造多或隱瞞少人口數據,佢哋就諗到個制衡嘅方法:
「因為國家的權力—議席要按人口的多少來分配,各洲需要向中央政府繳納的稅收也要按人口來分攤:想通過誇大人口基數獲得更多議席的州也要相應承擔更多的賦稅義務:同時,想要通過人們人口增長來避稅的州,將在國家的權力分配中失去應得的職位。這種互相約束的關係,促進了人口普查的公正性和準確性。」
之後書中有好多關於美國點樣得到數據、使用數據或者點解要去利用數據嘅事件:例如何樂禮喺1850年令美國真正邁向「人」口普查,由以前嘅數據以家庭為單位嘅「戶」口進化到以個人為單位嘅「人」口,佢又發明人口普查打孔機加速讀取數據過程同時訂下咗二進制嘅概念最後仲開創埋IBM嘅前身;又例如唔同部門/州政府/聯邦政府開始要量化成本效益再去嘈點計就整本「綠皮書」;計成本效益最後難免要幫生命定價,因為資源有限,可惜唔係人人都接受到咁理性,啲文件一出就會變咗「人命不及為節省11美元」之類嘅新聞,法院當時最後點收科;開始統計係盡量想所有人口都包攬哂,到有一派比較支持抽樣調查而最後又贏咗就開始跑出,有抽樣市場調查先問後拍「亂世佳人」,民意調查等都轉做抽樣;質量控制之父戴明點喺日本發圍令當時都係出名低質素嘅日本貨變到依加日本係品質嘅保證。
一直睇,時間線慢慢去到近代到政府(美國)資訊公開,數據透明、雲、物聯網、無人駕駛、AI,最後去到可以點樣用堆大數據整個「智慧城市」,有性就睇本書吧唔詳細抄落嚟。
本書嘅觀點可以幫到自己去理解數據對世界、國家、社會、甚至個人點解緊要,你嗰一票其實係代表緊咩?由其喺新嘅數位時代,當「你」就係商品嘅時代,好似我咁對數字唔敏感絕對冇益處。另外因為作者係中国人嘅關係,間唔中佢喺章尾就會用幾句講一講中国,行文間感覺到有啲恨鐵不成鋼嘅感慨,而有啲章節更透露出心聲。可惜小弟我身為香港人就當然諗香港,然後就得啖笑,出咗幾多報告講人口估算錯咗幾多年、香港仲有幾撚多地可以優先用唔使填海唔使用濕地,政府係唔撚理,因為香港政府唔係,都唔需要用數據諗嘢,夠紅就行了。話雖如此,大家都明香港政府唔係為香港人做嘢,但就算最後香港真係有我哋口中所謂嘅「民主」(定你會考慮一吓共和呢?),同上次一樣,引用返書中一句:
「民主的質量依賴大眾理性思考的水平」。
作者: #涂子沛
英文書名(應該冇英文版):”Big Data: History, Reality and Future”
出版:香港中和出版有限公司
ISBN: 978-988-8284-11-5
#數據之巔 #讀後感 #圖文並茂 #書 #書中自有黃金屋 #書中自有顏如欲玉 #閲讀報告 #books #書籍介紹 #閲讀 #閲讀筆記 #人文學科 #大數據 #講讀