博弈

地球上的叶子
·
·
IPFS
不得贪胜 入界宜缓 攻彼顾我 弃子争先 舍小救大 逢危须弃 甚勿轻速 动须相应 彼强自保 势孤取和 黑白相伴 以法阴阳 无为和无不为 变中有不变 不变中有变 有心恰恰无 无心恰恰有

三姬分金和五海盗分赃其实都是一类问题“纳什均衡”,最初来源于经济学,在分析之前要先明白一些关于博弈论的知识:

  • 局中人同时做决策的博弈,叫“静态博弈”。
  • 如果决策有先后,后面的人,可以根据前面人的决策,决定和调整自己的决策,就叫“动态博弈”。
  • 先决策的称之为:先手优势;
  • 最后决策的:低端人权,夹在中间,受制于两端的称其为:夹层;
  • 参与博弈的双方,事先都对规则十分清楚,又叫“完全信息”。

还有两个前提

1:每个人都是聪明人,知道自己所有决定的后果,并会为自己追求最大化的利益。

2:人性本恶,除了分得更多金币,每个妃子都希望处死其他妃子。

那么最终的结果会是怎么样呢?

抽签所分配的先后顺序我们用 A、B、C 来标注,如果是各位,可以想一下,你想抽到哪个。

思维实验开始!

如果抽到A,大家一定会一个激灵吧? 我们分析一下,如果根据规则,妃子都希望杀死别的妃子,A的任何方案是不是都可能被B、和C否掉,那A的处境是不是很糟糕呢。

那我们先假设A被B、C投票处死,B的处境会是怎样呢? 

B的处境将会非常凶险,也就是不管分配方案如何,即使她不要一个金币,所有金币都给C 。C都会投反对票从而处死两个妃子并且得到所有的金币。

也就是说投反对票处死A,那B也必死无疑。

我们现在可以重新反观局面,也就是B必然要保住A的性命,也就是不管A的分配方案如何,B必然会投同意票。A和B的合谋就是一个纳什均衡的局面,说合谋不太准确,因为B只是出于保护自己才必然同意A的方案。

A利益最大化的分配方案是(100,0,0),A同意,B同意,C可以忽略(这场分配中C不是关键加入者,属于不需要考虑的对象)

B和C能够合谋么?平分金币不是更好。

我们假定B、C合谋,投票处死A,之后我们就可以考虑C的博弈处境了,C反悔,B没有任何办法,对于B来说这个风险太大,不值得考虑。

这就是著名的 三姬分金 的故事

可以看出一些有价值的信息,也就是A因为抽签得到的先手权是打开了关键重要的局面,这个先手权就是权力的象征,而B、C则陷入了底层尴尬处境,因为可选项太有限,可见在这种有限次数的博弈中,先手权意味着锁定胜局

而且只要条件规则稳定,所产生的结果是必然的,这样的局面就是纳什均衡。

三姬分金:100两黄金,每姬提出一个分金的方案,如果前一人的方案不被后面的人认同,她就要被处死,以此类推,按照抽签决定甲乙丙先后顺序。你会怎么分?

从表面上来看,第一个人无论提出什么样的要求,第二个人和第三个人都可以否定第一个人的方案,然后被处死,第三个人在否定第二个人的方案,第二个人被处死,最后所有金币都归第三个人所有。

事实上真的这样吗?我们这么来分析:假如第一人自己给自己分99份,然后给第二人1份,从而她不能在分,也不能不认同第一人的方案,因为她如果不认同虽然可以将第一人杀死,但是她接过100份金以后不论自己怎么分都不会得到第三人认同,因为只要第三人不认同,第二人就会死,这样第三人独的100份金。因此,在这种情况下,第二个人必须认同第一个人,得到1个金币,而且还能保命。

这里还有个问题,就是为什么还要给第二个人1个金币,而不是第一个人拿100金币呢,这里其实反映的是人性问题,防止第二个人破罐子摔碎,反正我自己什么都没得到,你还这么难为我,那我拿不到,你也别想活着,然后就不同意第一个人的方案。

所以说,有时候,看似处于劣势,其实处于最优势。 好了,下面继续扩展,把三个人变成五个人,就成了海盗分赃问题了。

五海盗分赃:5个海盗抢得100枚金币,他们按抽签的顺序依次提方案:首先由1号提出分配方案,然后5人表决,超过半数同意方案才被通过,否则他将被扔入大海喂鲨鱼,依此类推。海盗在自己的收益最大化的前提下乐意看到其他海盗被扔入大海喂鲨鱼,假定每个海盗都是绝顶聪明且很理智,那么第一个海盗提出怎样的分配方案才能够使自己的收益最大化?

逆推法,从后向前推,如果1至3号强盗都喂了鲨鱼,只剩4号和5号的话,5号一定投反对票让4号喂鲨鱼,以独吞全部金币。所以,4号惟有支持3号才能保命。

3号知道这一点,就会提出“100,0,0”的分配方案,对4号、5号一毛不拔而将全部金币归为已有,因为他知道4号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。

不过,2号推知3号的方案,就会提出“98,0,1,1”的方案,即放弃3号,而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利,他们将支持他而不希望他出局而由3号来分配。这样,2号将拿走98枚金币。

同样,2号的方案也会被1号所洞悉,1号并将提出(97,0,1,2,0)或(97,0,1,0,2)的方案,即放弃2号,而给3号一枚金币,同时给4号(或5号)2枚金币。由于1号的这一方案对于3号和4号(或5号)来说,相比2号分配时更优,他们将投1号的赞成票,再加上1号自己的票,1号的方案可获通过,97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了!


答案是:1号强盗分给3号1枚金币,分给4号或5号强盗2枚,自己独得97枚。

博弈能很容易延伸到200个海盗(如果有更多金币,甚至可以更多)。艾恩·史都华在1999年5月期的《科学美国人》中,将该博弈延伸到任意人数的海盗,得到十分有趣的结果。 [1]

设共有N个海盗,等级最低的海盗为1号,其次为2号,依此类推,等级最高的是N号,若N ≤ 200,则N号海盗的分配法为:自己{\displaystyle \left\lfloor {\frac {202-N}{2}}\right\rfloor }个金币,其馀海盗中,编号和N的奇偶性相同者每人各1枚金币,奇偶性不同的,什么也得不到。 201号海盗必须要有101票才能通过,他没有办法,只能自己不拿金币,而给1~199号中奇数号的海盗每人各1枚金币,这样他以及1~199号中的奇数号会投赞成票,这样就刚好101票,提案即可通过。 202号与201号类似,自己不拿金币,而给2~200号中的偶数号每人各1枚。 到了203号,情况第一次有了一百八十度的大转弯,因为他需要102票,但是他没有足够的金币去收买101人,无法通过。 204号则较幸运,因为203号知道他唯有支持204号才能保命,所以204号可以给1~199号中奇数号的海盗每人各1枚金币,因为他知道,203号虽然一无所获但还是会投赞成票,再加上自己一票以及1~199号中奇数号的100票,就达成了102票的条件,所以他的提案就可以通过。 205号就没那么走运了,他不能指望203号与204号支持他,所以没法通过。 206号也是一样,因为他需要103票才能通过,所以就算205号会支持他,还是差1票。 207号则需要104票,但是他最多也只能得到103票(他自己、205号和206号、以及1~200号中的100人),所以也不能通过。 208号则又时来运转,他可以给2~200号中的偶数号每人各1枚,这样他们会同意他,同时他自己跟205, 206, 207号也会投赞成票,刚好104票可通过。 此时,我们继续分析,可以得到一个新的序列:201, 202, 204, 208, 216, 232, 264, 328, 456, 712, 1224, ... ,这些编号的海盗能够存活,他们依次要分给1~200中的奇数、偶数、奇数、偶数、奇数、偶数、 ...号每人各1枚金币。所以当有1500位海盗时,前276名等级最高的海盗必死无疑。轮到1224号海盗时,他可以只分给1~199号中奇数号的海盗每人各1枚金币,而其馀的海盗什么也得不到。

一般地,对于任意给定的金币 G, 海盗数目 N。上文中等级不高于 (2 * G) 的海盗都有存活机会;但对于等级高于 (2 * G) 的海盗,只有编号 (N - 2 * G) 为 2 的整数次幂的那些海盗有存活机会,其余海盗必死无疑。第 N 号海盗只需给编号在 (2*G) 以内跟他/她相同奇偶性的海盗分配 1 枚金币即可,其余金币都归他/她自己,但编号大于 (2*G) 的海盗分不到金币。利用计算机编程很容易验证这一结论。


1.胆小鬼博弈:


有“死磕”和“示弱”两种选择,都死磕会两败俱伤,自己死磕对手示弱收益最大,纳什均衡点有两个,就是一方死磕另一方示弱。


因此,为了收益最大化,要采取的策略是:装成“死磕”到底的样子,让对手示弱。


也就是俗话说的“横的怕楞的,楞的怕不要命的”


2.一美元拍卖陷阱


5分钱起拍一美元,出价最高的获得1美元,出价第二的也要付钱,最后两个人为了避免自己的投入打水漂(沉没成本)而不断投入,最后结果是拍到几十美元。


举例:价格战(共享单车、打车软件、外卖软件等)

3.美女与男人的游戏(炒股的散户为什么总赔钱)

投硬币,同正+3,同反+1,正反-2

通过解不等式可以得出,只要美女投硬币以1/3-2/5这个概率投正面,在期望上是有优势的,玩的越多,男人输的越多。

囚徒有“坦白”与“抗拒”两种选择,都抗拒,-1,一方坦白一方抗拒,坦白-0,抗拒-10,都坦白,-8。

在这种情况下,纳什均衡点在都坦白上。纳什均衡点并非“最优解”,但是没有人愿意改变规则。

举例:闯红灯、不守规矩造成堵车

改变策略:“串谋”

“智猪问题”:小猪必然选择等待,大猪只能去

举例:大企业开拓市场,小企业搭便车;为什么自己生产高端芯片


6.华容道为什么关羽要放走曹操?

曹>孙>刘,在这种情况下,曹打孙,孙打曹,刘打曹,因此孙刘要联合,然而如果把曹打死,刘的存活率会下降,因此诸葛亮故意让关羽守华容道,放走曹操,维持均衡。

旅行者困境


两个旅行者丢了同样的东西,航空公司赔钱,让他俩写价格,价格相同照价赔偿,价格不同按最低价赔偿,价高的人会被罚款

举例:超前教育,以前提前半夜排队买车票等,恶性竞争的万恶之源

模型局限:跟奖惩力度有关,实际问题更复杂。



但是实际上,信息并不透明,大家不知道谁强,为了避免被当出头鸟打,要低调,韬光养晦



CC BY-NC-ND 2.0 授权

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!