欸!賽局不是這樣用的啦~
賽局老師魂上身。讓我來正確示範一下為何謹慎「防疫」為目前台灣最好策略。
網路爆款文:「賽局理論」看「防疫策略」
前晚吃飯時一個好友傳了篇FB社群媒體爆紅的文章給我;點開連結,看到作者用「賽局理論」談 covid-19 (新冠狀肺炎)疫情防災策略,眼睛為之一亮,馬上往下閱讀。
很可惜,文章裡的「賽局理論」觀念並不正確,但已有幾千人點閱,整頓飯吃得十分忐忑。考慮了15分鐘後職業病發作、老師魂上身,我就豁出去了。
賽局理論糾察隊
先到作者的文章下面留言,提醒他:賽局裡「策略」(strategy) 和可能「結果」(outcome)是完全不同的概念。
進一步加了作者為好友,私訊跟他討論更深層的賽局理論問題。
作者很客氣,溝通後,我畫了個賽局矩陣表(payoff matrix)解釋:以他的數字設計,正確運用賽局理論工具推出來的結論,與他想表達的論點恰恰相反。
(按:文章說到賽局裡玩家「全面防堵或是全面減災都是辦不到的事」,但他的賽局架構導出來的結論與此自相矛盾。)
有鑑於此火紅網路文章案例,筆者感受到大家對賽局理論有興趣,希望藉此導正賽局理論的觀念。
此文會以 covid-19 防疫時事為題目,以賽局理論架構,用賽局矩陣表(game matrix)的架構及工具來拆解此防疫策略局勢。
先談賽局入門(以前的文章有說過,熟悉的人歡迎跳過)。
賽局理論入門
賽局基本入門的要素:
1. 玩家(player):玩家必須多於一人,兩人成局的概念。
2. 策略(strategy):指的是在所有可能發生情況下的一套完整行動計畫;這完全決定了玩家的行為。
3. 得失/支付(Payoffs): 「得失」指的是賽局裡玩家在每個可能的行動的「得」與「失」。簡單些,可以想成玩遊戲裡的「得分」。而由於這個「得失」取決於對手玩家的策略,學術上一般以支付(payoffs)的函數來計算。
4. 最佳反應(Best Respond, 下簡稱BR):針對「對手玩家」的某一策略,能帶給此玩家最優「得失」(payoff) 的策略為最佳反應。換個角度想,最佳反應(BR)是在問:當對手出某一招,你出哪一招分數才會高分。
5. 均衡(Equilibrium):均衡就是平衡,也是最終的賽局結果。在賽局裡一般簡單的均衡指的是「納許平衡」(Nash Equilibrium)。
防疫策略賽局
先說此防疫策略的假設。
假設:
- 兩位玩家:國家A & B
- 兩個策略:「封鎖」 (Lock-down) & 「防疫 」(Containment)
- 兩位玩家在下列等條件上有相似背景:醫療資源、人文、政治態勢、經濟體系及規模,且目前皆處在「未爆發重度社區感染」
- 採「封鎖」策略下得分:
▪️ 如兩位玩家同時採「封鎖」策略,成本為 80,得分為 -80分(因為是負數,所以分數為負數)
▪️ 如單一方採「封鎖」,其成本為100,因為採封鎖的那方還得加派人員防守對方人員到境內,得分為 -100分
5. 採「防疫」策略下的得分:
▪️ 如兩位玩家同時採「防疫」策略,成本為40,得分為 -40分
▪️ 如單一方採「防疫」,其成本為 60,因為還得加派醫療人員等,協助追蹤境外移入感染,得分為 -60分
從上得分設計,可看出此賽局假設「防疫」成本比「封鎖」成本低;當然,採「防疫」策略對醫療體系造成的衝擊,以及社會成本也很高。但畢竟「封鎖」的先期成本(軍方、官方、海關等)相對高,更不用論採「封鎖」可能造成的恐慌效應、企業、勞工等的其他社會成本。
賽局矩陣 Game Matrix
此賽局有 2位玩家(player),雙方有 2個可選的策略(strategy),所以共有 4個可能發生的結果(outcome)。
賽局矩陣(game matrix)就是將玩家的得分(payoffs)放入一個 2x2 的表格示意,如表一。
玩家的得分(payoff)讀法,每一格的左邊的數字代表國家 A的分數,右邊的是國家B的,如表右上的定義。
用賽局矩陣的小技巧來拆解國家A的最佳反應(BR)。
當國家 B採「封鎖」策略,請看表格的左邊兩格,圖示綠色箭頭處。
從表二可知:國家 A 採「封鎖」payoff 為 -80,採「防疫」payoff 為 -60分,-60 > -80。故,當國家 B採「封鎖」,國家A的 BR 是「防疫」。
註:賽局小技巧,把高分的數字圈起來代表是 BR,如表三綠圓圈。
如果國家 B採「防疫」策略,請看表格的右邊兩格。同樣方法,從表四可看到 -40 > -100, 國家 A的 BR一樣是「防疫」。把高分的圈起來,如表四右邊的綠色圓圈。
再介紹一個賽局新名詞「優勢策略」(dominant strategy):不管對手出哪一招,玩家出此招都拿較高分,這就是優勢策略。
由於不論國家B採哪一策略,國家 A都是「防疫」比較優,所以「防疫」是國家A的優勢策略為防疫。
國家 B的分析就不一步步操作,循上分析,結果如表五。
使用紫色圈來畫出國家 B的BR,不難發現,國家 B也有優勢策略,一樣是採取「防疫」。
當有個可能賽局結局 (possible outcome)是雙方的 BR時,此時賽局已找到平衡點,稱為納許均衡,雙方都會理性「防疫」。
賽局結論:兩國都會採「防疫」策略而非「封鎖」策略。
註:畫圈圈這賽局小技巧是用來幫助尋找均衡,當 payoff 矩陣裡每位玩家的 payoffs 都被圈起來了,代表找到賽局終點。
結語
當然此賽局簡化了很多其他可變的因素及參數,也假設了政府有能力追蹤每一位入境者的旅遊史,感染史,而且醫療體系尚足夠應付。此賽局也只探討靜態(static game),實際上這些情勢隨時在變化,應為動態賽局(dynamic game) 。不過,這個簡單的賽局分析結論,剛好呼應了台灣當局目前的策略。
在社區疫情未大爆發前,採取「防疫」這個策略,審慎查尋每一位確診案例染症來源,追蹤確症個案接觸人士,謝絕疫情嚴重區之入境,加強自疫區返國人士的自我居家管理,隔離患者,杜絕傳染,未染症國人加強勤洗手、出入人多場合戴口罩、大型活動延遲舉辦、減少外出等自我保護措施,相對是比全面「封鎖」來的理智。
剛才賽局理論的分析,也佐證此為現階段最佳的手段:嚴謹「防疫」為台灣目前最優的策略。
🃏 If you like to see the English version of this, please visit here. 🙏
歡迎參考之前發布的其他賽局文章:
1. 逃之夭夭:此篇有介紹賽局裡的「策略」、possible worlds 等。
2. 又毀了?:此篇談到賽局的 outcome。
3. Just Do It (JDI)-1 :此篇針對最佳回應(Best Respond)有介紹及例子。