此为历史版本和 IPFS 入口查阅区,回到作品页
TtBoMr972
IPFS 指纹 这是什么

作品指纹

宝箱怪物与经济人

TtBoMr972
·
·
"Sometimes I wish I had a thousand lifetimes. I don't know, Phil. Maybe it's not a curse. Just depends on how you look at it."------Groundhog Day







"Sometimes I wish I had a thousand lifetimes. I don't know, Phil. Maybe it's not a curse. Just depends on how you look at it."------Groundhog Day



概念解释


01 S/L机制

打过单机游戏的同学可能会对S/L机制有所了解。S/L的全称叫做Save/Load,即存档读档。大概有两种用法,第一种是主要针对文字冒险类游戏,通过在不同时刻进行存档,选择不同的选项来达到不同结局的目的,第二种则是针对游戏中的随机数系统,比如许多冒险游戏中尽管是同一个位置的同一个宝箱,每次开启宝箱都有可能掉落不同属性的装备,所以通过在开启宝箱前存一个档的方式,如果开箱后掉落物的属性不佳则重新读档再次开启宝箱,直到掉落物的内容是自己想要的才停止。

02 经济人

经济人是一个社会学而不是心理学上的概念,又叫“经济人假设”,即假定人思考和行为都是目标理性的,唯一试图获得的经济好处就是物质性补偿的最大化。通俗一点讲,在能赚15块钱、50块钱、51块钱时,一定会选择赚51块钱而不会是其他两个数额。在社会学研究中,常常将博弈的每个个体视作理性人来进行,并以此作为博弈的基本逻辑



宝箱


假设宝箱中包含五个品级的装备:

 5%掉落率的橙色传说装备A、B、C、D

10%掉落率的紫色史诗装备E、F、G、H

30%掉落率的蓝色稀有装备I、J、K、L

35%掉落率的绿色普通装备M、N、O、P

20%掉落率的白色垃圾装备Q、R、S、T


其中A>B>C>D,同时A=2E,E=C且F≧D,(其他品级遵守同样规则)。


同品级的装备字母越靠前属性越强,相邻稀有度中高稀有度最强力装备是另一稀有度最强力装备的2倍,存在品级逊色但属性更强的情况。


按照理性人假设,玩家应该在通过反复S/L来让自己得到A装备后才会停止操作并且离开,进行后续的游玩。

理由很简单,A装备给角色的提升最大。



经济人何在?


实际情况真的会这样吗?相信大部分玩家会选择在刷出A、B、C、D、E、F中的任意一件后就选择终止刷宝箱,一方面是因为这些装备的属性应该强大到足以应对后面的敌人,另一方面是因为反复S/L极其消耗人的精力时间,让游戏乐趣迅速消失。所以较为常见的情况应该就是刷到一件足够满意的装备后就离开。


为了记录游戏角色的状态,需要一个量来进行观察,选定角色强度P,初始强度为0,我们将开出A装备时增加的角色强度计作Pa,开出B装备时增加的强度计作Pb,C则是Pc,以此类推。同时假设通过接下来一个关卡怪物所需要的强度设为Pm,即拿到某一特定字母之前品级的装备都可以无压力通关下一关,也就意味着玩家在下一次遇到新的怪物之前拥有了P-Pm之间强度差的容错ΔP


同样的,一整场游戏中并不会只有一个宝箱需要玩家去开启,我们将下次开启宝箱后增加的角色强度计作P’,再下次增加的强度为P’’,那么到最终的强度就将是P=Px+P’x+P’’x…而怪物的强度也在不断增长,但增加强度随机,只要在每次对抗时保证P>Pm+P’m+P’’m…就可以立于不败之地,成功通关。



两位玩家


如果让理性人去玩游戏,并且使用S/L机制来帮助自己开宝箱,那他的P=Pa+P’a+P’’a+…将会远高于击败最终boss所需要的PM。


而另一名玩家每次S/L都在自己拿到认为足够通过下一关的装备后就停止刷宝箱活动,到最后同样也能通关,因为此时P≈PM


二者的区别在哪?


假设每次怪物强度平均提升Ph(但不固定),只要每次宝箱开出包括H之前稀有度的装备就可以通过,平均每回理性人玩家将使用80次S/L机会来确保自己提升Pa,而普通玩家平均只要3.3次S/L机会(开出A-J之间的任意装备)就可以获得至少Ph的提升,如果整场游戏有五个宝箱,那么最终理性人玩家将使用400次S/L机会,另一名玩家只使用了16.5次,可以看到两者的付出是天壤之别,但同时他们得到的收益是一致的,即通关游戏。


此处产生两个平行问题:


那为什么还是有大量玩家会选择花大量时间将自己的角色强度提高到一个极其恐怖的程度后才去挑战下一只怪物?


因为这样能够减少下一次需要的S/L机会数量,因为本次开箱积攒的容错ΔP能够减少下一次开箱的必须提升强度。对未来的不确定性导致对当下的极度保守判断,极端保守的判断带来巨大的成本和极低的收益。


为什么会出现这种情况?


最直接的原因是游玩游戏这一过程只进行有限次的开箱和打怪,理性人玩家每次开完宝箱给自己带来的额外容错ΔP无法在通关游戏后转化为额外的收益。如果游戏的流程无限长,那么ΔP对于玩家的意义才会无限大。



如果不是宝箱和怪物


这个模型同样适用于两个博弈的单位(可以是个人、队伍,也可以是对抗中的国家)。如果双方进行博弈,一方严格执行理性人策略,以极高的代价换取每次提升都是Pa,另一方没有严格执行该策略,用相对较小的代价换取较高回报的提升Px,博弈进行次数足够多后,就会在某一次提升面前出现这样一个局面:就算在理性人下次0提升的情况下,无论另一方下次提升多少,都无法博弈胜出,即出现代际差异时,理性人将终结博弈,杀死对方。从最后一次提升往回推导,另一方会再倒数第二次博弈之前,开始无限执行理性人策略,双方的开支也就可能逐渐压垮自身。历史上的军备竞赛也是如此,并没有出现真正的战争的时候,军费开支预算已经不允许再次提升武器水平了。


之所以会发生这种事,是因为博弈的双方倾向于将这场博弈视作无限博弈,所以才会有保守的判断和后续行为,如果事先就知道将要进行的博弈次数与对方每次加码程度,决策者必然只会采取成本最低而收益最高的投资行为。可惜现实中既没有办法了解对方的意图,也不能确定博弈的行为将持续几轮,同时输掉博弈的代价又过于高昂,才会有种种看起来得不偿失的经历。


这是否与通常将无限博弈视作有限次博弈破局的结论冲突?通常所说的博弈,只是决策上的改变,在操作中并没有明显的难度,主要在于思想上的劳动,而本文中的博弈则有昂贵的博弈成本。



第一次接触


并且绝大多数时候,人遇见的事物都处于第一次接触阶段,一切都有细微的区别,而我们就会抓着这点区别不放,认为是在应对全新的事物。就像打一周目游戏的时候,连瓶血药都想能省尽省,最后通关最终boss后会发现,背包里有如山多的补给品。只有这个时候才会意识到当时自己兢兢业业应对路上所有怪物都有点得不偿失。当既有经验没有办法为当下的问题提供判断基础时,保守判断是最常用的手段。那么就要接受保守判断下的低收益后果。


人类的历史上从未发生过完全一致的事件

人类历史上也从未有过一次真正公正的判决

每一次审判也都是独立的审判

每一场战争也都是不同的战争

看不清未来

回不到过去

所以我们

永远保守





保守当然不是错

错在我们不能重来

CC0 公众领域贡献宣告