【《數據之巔:大數據革命,歷史、現實與未來》書評】
今天想介紹這一本《數據之巔:大數據革命,歷史、現實與未來》,是由科技作家、大數據專家、也是阿里巴巴的前副總裁,涂子沛所撰寫的有關人類數據運用數據歷史的一本著作,當中提出的“大數據”概念,也算是目前非常火熱的話題。
這部著作分為上下兩部,從美國建國開始制定現代意義上的人口普查講起,到南北戰爭中運用數據去作戰、指導國內農業生產、抗洪防災、協助市場調查,到當代美國,開始強調“內開放”,要開放各類數據,讓公眾可以應用它們,使市場可以更為透明、資源的分配更為合理,有助保障公眾知情權、促進民生經濟,而且,當數據開放到一定程度時,更可以推動技術創新。當然,由於社會的日益發展,人們將面臨規模越來越龐大、數量越來越繁雜的數據,這就需要有更為精準、快速的統計技術。本書由美國到日本再到中國,貫徹始終以人類對數據的運用歷史為線索,源源本本地展示出數據的搜集及其應用是如何推動人類文明的進展,以史帶論,迭有洞見,令人有耳目一新的感覺,並能啟發讀者的各種思考,各種統計技術如可視化的統計圖、數據打孔機到抽樣調查、再到現在的智慧城市治理、傳感器、物聯網萬物可聯等的介紹,也是一部統計技術的發展史,對讀者而言也是很有意義的科普閱讀。
書中揭示一點很有參考價值的是,原來當初美國啟動人口普查的目的,是為了要清查人口數量,訂定各州議席的分配,也就是有多少人口就分多少權,同時有多少權也就要納多少稅、有多少義務。當人口普查開始了,人們就發現,除了收稅選舉外,數據還可以解決很多實際問題,例如農作物要生產多少和供應去哪些需要的地區從而確保市場機制可以發揮作用效益、打仗可以從食糧水源等分佈數據去決定最佳行軍路線、更可以從病例主要分佈在水井旁決定霍亂的傳染源有效提升公共衛生等等,數據可以幫助人們掌握實況、發現問題和解決問題,提升整個社會的生產力,不只如此,美國日益完善的數據文化,甚至有助發現黑奴受虐待的嚴重性、勞工是否受到苛刻對待,對於提升社會各階層的權益、推動人權發展都有好處。近世以來的數據開放,也有助公眾去反映市政問題監察政府工作、了解社會大眾的消費喜好和行動習慣,從而帶來各種創業機會,這些都是數據化、智能化治理的好處。作者在書中有一個論斷,就是數據,正在成為這個世界上最重要的土壤和基礎。這一點我是頗為贊同的。
最後我也講一講自己的一些看法。之所以在今日講這本書,是因為最近澳門人口普查的詳細結果公佈了,令我有感而發,想講一講澳門日後的數據開放和治理。回顧近年,其實澳門也推出了總城規、交通十年規劃等長遠規劃諮詢。但我在讀這些諮詢的時候,總有種未能緊扣數據作規劃的感覺。就以今次交通規劃來講,當中的跨海纜車方案,真的就只有一句運用纜車,至於纜車的使用,可以帶動到多少人口使用、疏導到多少交通流量、在澳門天氣情況下一年可以運作到多少日、要花多少錢等等數據,基本上沒有,大膽構想是好,但也要建基在堅實的數據土壤上才可以有說服力,也從而知道方案到底有沒有可行性、避免到被公眾質疑從而削弱公信力的弊端,也正如這本書所講,這些是現代科學施政、智能型治理的基本要求,但顯然現在政府不太重視這些事。今次的人口普查出來了,我也覺得是時候要讓社會有討論,如何在今次的基礎上精益求精,加強數據開放,推動社會的生產力和創新。我認為目前可以做的,當然是依據最新的分區普查數據,去優化分區規劃,例如根據人口數量、密度和分佈,去針對性補充當區相對缺乏的社區配套,例如人口稠密的新橋區、林茂塘區,其實現在仍然比較少的智能回收機及工作時間較長的回收點,那就應該要補充上去;例如青洲,應該要快些補充醫療、商業、育兒親子、長幼共融設施,適應人口快速增長的趨勢;例如分區規劃也要參照今次普查中的人口老化大區荷蘭園區,配置更多的原區安老設施包括日間長者中心、社區中心等等。
而且,在日後,我也覺得政府應該要加強所謂“白日人口”的數據收集及開放工作。白日人口,也就是指一個地區在8小時的上班時間內有多少人流的數據。目前交通局在這方面數據的收集和開放仍然做得不足夠,由於大家不了解澳門白天工作時間內人口上班上學的流動情況,因此今次的交通規劃根本無法在數據基礎上進行論證和規劃,公眾更難以判斷政府給出方案的可行性和得失,這就決定了規劃只是一場字面的過場討論,無法成為堅實的科學施政實踐。在今後的數據爆炸時代,地區政府必須要重視數據文化,否則日後就很難保持到地區競爭力。今日我特別去提這一本書,其實也是為了推廣數據文化,冀望能夠引起大家的關注討論、研究分析,從而推動社會的進步。