雜感#3
想要寫這篇文章很久了,原本想要大肆批評,但過了一陣子,情緒已經沒那麼「濃厚」,因此決定好好陳述我上學期遇到的困擾。台北市政府和教育部造成的困擾。
>台北市新工處「坑洞查詢」
大四下學期修習學校的「資料新聞學」課程,目標是搜集、整理資料集,分析資料、採訪,完成一份專題報導。雖然最後沒有被業師選上,但讓我對新聞的想像開闊許多。但我必須說,上這門課大部分的時間我都覺得自己很爛,沒辦法愉快的學習。即使老師已經幫忙很多了,我還是會一直對自己的能力感到擔憂。
回到我的困擾。在搜集台北市道路坑洞資料的時候,一開始我們很開心發現很龐大的資料集,總共有超過三萬筆資料(台北市新工處坑洞查詢),也可以從這些資料發現一些趨勢。但後來在製作點圖的時候發現,為什麼沒有三萬多個點,有些地區看到的點很零星。才發現有些資料被重複登記了上百次,真正不重複的資料只有一萬多筆。也就是三分之一。
整個分析的樣本瞬間少了許多,而且原本認定的趨勢瞬間不見。也就是說,我們差點誤判了A和B之間的關聯性,寫出一篇錯誤的報導。跟新工處反應之後,他們也沒有針對這個問題回覆。台北市雖然是資料最多(最透明?)的縣市,但是資料管理並沒有做好。
>教育部統計處《2021教育統計國際比較》
在上篇有提到的實習工作也遇到類似的政府資料管理失誤,甚至更嚴重。研究主題是「台灣公部門在高等教育產業的投入」,研究成果請參閱台灣高等教育產業工會官網,心路歷程請看上篇。
統計處第一個失誤是「公部門」定義錯誤,若不分清楚公私,完全無法進行後續研究,且OECD對公部門定義在他們的出版物寫得清清楚楚,很明顯製作這份統計的人就是不認真而已。在我們更新定義之後,台灣公部門在高教的投入是OECD國家中的最後一名。
第二個失誤是混用各國的購買力平價標準,台灣因為不是OECD會員國所以只能使用其他國際組織與美國一起平準過的數據但是OECD有一個自己的平準系統。正常人都知道,不同的平準系統不能放在一起比較,否則結果失準。但統計處還是犯了這樣的錯誤,且沒辦法及時修正。
這兩個失誤都行之有年,且都導向膨脹台灣公部門投入的結果,卻從沒人發現。教育部得知我們指出的錯誤後,第一個反應是否認並指控公會引用錯誤。第二個反應是以「防疫很忙」為由延遲修改進度,要求工會不要再繼續發起記者會。我就是覺得這件事很氣人,兩個月過去,仍無聲無息,一定得寫出來。
>結論
資料公開是民主的一個重要環節,讓人民可以無時無刻取用資料做研究、監督政府。因此資料管理也是民主進程中的必要,若資料管理不確實,不僅研究會失準,更會使民眾、國際組織沒辦法信任台灣政府。信任是一個國家的基礎,希望台灣的資料公開可以做得更好,資料管理的品質可以改善。
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!