此为历史版本和 IPFS 入口查阅区,回到作品页
Derek
IPFS 指纹 这是什么

作品指纹

古人都会用AB测试了,你还不会用?

Derek
·
快活日子到头的小校尉变成了阶下囚,本以为死路一条,却忽然看到了新世界的曙光 - 如果把AB Test用到古代社会,会发生什么事情?

王小五是个长安城门的一个小校尉,管的是人进人出的业务,主要负责盘剥百姓的进城费。

原本只管吃喝嫖赌和搞钱的他,从没想过自己一个军痞会和朝廷大事有什么牵连。唯一和官老爷们打交道的,也只是天亮时城门守将吩咐今日的配额,天黑关城门后交上自己那份孝敬。

直到这天,他因为完成不了上司所制定的份额,被枷锁加身打下狱中,方才知道朝廷北面战事吃紧,将领们人心惶惶,所以变本加厉的盘剥,想赶紧多捞点银子。

也是,王小五脑袋的上的份额每天都在增加,到今天,数字庞大到了即使是盘剥成性的他也终于凑不齐了,所以才沦落到了牢里面。

王小五抬头看了看自己身处的这间昏暗牢房。他曾经无数次的把其它人送到这里,却从未想过有一天自己也会住进来。

早知道我会这样,还不如听听下面人的建议,把这里的卫生好好的打扫打扫。他望着墙角处的忙活的热火朝天的蟑螂和老鼠们不由出神的想着,眼睛却忽然被墙边的字迹所吸引住。

这个字迹似乎只是整体的一部分,更多的内容似乎是半遮半掩,被各种泥巴和灰尘掩盖住了。不过王小五左右无事,便拿稻草慢慢的将污渍从墙上扫去。逐渐的,一整篇文章展露在了他的面前。

以下是这篇文稿的原文。


明知道明日正午我就会在菜市口被处死,我的大脑仍然拒绝接受这个事实。

作为一个穿越者,我竟然在宏图未展的时候就死去了。这和我前辈子在成为P9之前加班到猝死有什么区别?更何况这次连加班猝死都不算,只是为百姓多说了一句话而已。

我本不想留下什么记录,但想到我大脑里面的知识或许对这个年代的人们来说是如此珍贵,一种强烈的责任感迫使着我写下这篇文字。虽然我并不觉得自己属于这个世界,我仍想为这个世界贡献最后一点力量。

正在读这篇文稿的人,无论你是谁,下面的知识将改变你的命运。

什么是AB测试

我要告诉你的是,我有办法验证一个决策是对还是错,既不依靠占卜算卦,也不指望万载之后的后人评说。

这个办法在我们那个时代叫做AB测试。简单来说就是我们用相似的两群人来做一个实验,在保证所有其他条件都一样的情况下,控制那个唯一不同的因素,然后观测两组的不同结果。

当然,做起来会有更多的步骤和不确定性,所以不妨用一个例子来给你说明——就拿我的同僚王小五管的进城费来举个例子。

目前进城费是三文钱一个人,王小五在收完了一天的钱之后,把上头要的孝敬交上去,剩下的就给自己和兄弟们当辛苦费。但是今天的时局下,我看得出来王小五越来越难做了。如果他把进城费提高到六文钱一个人呢?会不会好过些?

自然,进城费是六文一个人的时候会有更少的人愿意进城,但是可以从每个人身上收到的更多的钱;进城费是三文一个人的时候,确实有更多的人愿意进城,但是你从每个人身上收到的进城费也少了。

这看起来是个很难做的决策,而且即使加了价钱,王小五怎么判断到底有效还是无效呢?难道只是把收六文钱的时候和收三文钱的时候做个对比,看看哪一天收到了更多的钱?

这种方法的问题是你无法排除其他因素对结果的影响。譬如收三文钱的那一天中城里可能有集市开张,城郊百姓天然更愿意进城,而收六文钱的那一天里城里可能有哪位贵人出行,四处封街封巷。

AB测试的假设

一个更好的做法是在同一天里北城门收六文钱,南城门收三文钱,一天结束之后再比较两个城门的总收入。因为这个实验发生在同一天,所以城里发生的事情并不会影响我们的实验结果;也因为长安之大,往返千里,很少会有人为了三文钱,从北城门跑来南城门入城。

当然了,我们的实验合理性也建立在其它条件的尽可能相同上,譬如住在北郊的城外百姓和住在南郊的城外百姓数量是大致相同的,购买力和进程欲望也大差不差。

因此我们可以认为这个实验就是我们所说的AB实验。

AB测试的合理性验证

但是在实验开始之前,我们还需要做一个额外的验证:北城门和南城门在历史上的每日出入人数大体是不是一致的?用下面的式子们来做这个验证。

理想情况下,上面的计算数值应该满足以下条件

AB测试的假设和实验单位

那么现在要做的事情就很简单了。我们认为,如果我们将进城费提升到六文钱一个人,我们会获得更高的每日收入,因为每个人交的钱变得更多了——所以我们也就有了衡量我们这次实验成功还是失败的重要指标:单日进城费收入。

基于这个单日收入,我们不难想到的是,我们并不关心有多少个人进入过这个城市,我们只关心自己一天到头拿到了多少钱,于是我们也就有了我们的实验单位——每日。

AB测试的最小样本量计算

有了实验单位之后,我们需要进一步的评估:为了得到一个可靠的结论,我们需要实验多少天?

假如城门的将军催的很紧,我们能不能用三五天的时间就知道应该收六文钱还是三文钱?

这就要求我们必须要计算基于实验单位的最小样本量,而为了计算最小样本量,我们必须要知道的是,当我们说收入有所提升或者有所下降的时候,我们能够容忍的偏差区间是多大( � ),

什么是偏差区间?要知道,天下没有绝对的事情,当我们希望判断哪一个收费标准可以当为我们赚到更多的钱的时候,我们既需要定义这个“更多”具体是多少,也需要有一个允许这个判断犯错的空间。

如果你对自己的小命很重视的话,你可能希望犯错的空间越小越好。但即使是0.01%的大小,这个空间也是100%存在的。

于是你会希望这个区间越小越好。记住,这个区间和你的样本量是一块跷跷板的两端,当这个区间越小的时候,你所需要的样本量就越大。当你希望将这个概率压到百分之0.01的时候,你可能需要十年时间才能验证哪一个标准更为稳妥。

不妨问问你的上官,他同意你试验这么长时间吗?

获得最小样本量的最后一步是你平时的收三文钱时候的日均收入的标准差。每天的总收入都可能不一样,今天多一些,昨天可能少一些,但是你需要一段时间之内的平均水平,把所有高高低低的情况都尽量囊括入内。比如说,过去六个月的平均日收入和标准差。

接下来只需要把上面说的种种加入到下面的式子,你就会得到一个最小样本量的估算结果。

这里的数字会表示着你最少需要多少天才能得到结果。

AB测试的实施和AB测试结果的合理性判断

到这里,你已经有了一切实验前的准备工作了,是时候选一个良辰吉日,真正开始做你的实验了。

记得多找几个信得过的人,去站在城门口附近记录进出人数,同时观察城门口是否有什么异样的情况发生。他们相互之间不应该认识,甚至都不应该知情其它人的存在。

为什么要额外派人去记录呢?明明只需要看检查最终的账簿记录,就可以知道收入多少钱了。

因为我们办的是朝廷的差事、杀头的买卖,所以随时都要记得留有额外的后手做些校验,确定账本上面没有出现明显的错记,漏记或者是和实际完全不同的情况,从而防止最终判断被你的账簿先生中饱私囊或者是哪个刁民在城门边挖了狗洞之类的事情而扰乱。

当最小的样本量天数已经达到的时候,你需要结合手上所有的信息去判断这个AB测试是否一切正常,排除可能扰乱结果的场外因素。

AB测试的结果分析

假设你的运气很好,一切看起来都还合理,就可以进入到最终的分析了。

用下面这个式子,分别计算出南城门和北城门各自的收入区间。

接下来,比较南北城门各自的收入区间吧。如果你发现北城门(收六文钱)的上限仍然低于南城门(收三文钱)的下限,你的小命恐怕就保不住多久了;如果你运气好发现恰恰相反的话,你就要发达了!最理想的情况下,你可以赚两倍的钱!而且这经过实验得到的结论让你对赚钱十拿九稳!

我知道上面有些的内容和词看起来让你很困惑,尤其是那所谓的式子。如果你有机会出去的话,去城东李记当铺,赎回我当在那里的书,你会从里面学到这些东西的。

祝你好运。

黄正绝笔


王小五紧紧地盯着墙上的字迹,愣愣的出神了半晌。他是知道黄正的,这家伙上个月血谏兵部然后被砍头。不过在被砍头之前,黄正一直是城门军里的天之骄子。

但是这篇莫名其妙的文章是什么意思?难道是黄正的武功秘籍?可也没听说黄正的武功好到哪儿去,只是据说手下管的生意样样赚钱——难道是赚钱秘籍?这文章里用自己举例子又是怎么回事?天下真有这么巧的事情吗?自己刚刚入狱,恰恰就看到了黄正用自己举例写的文章。

王小五是个嘴巴快过脑袋的粗人,反正眼下也没什么可失去的了。虽然上头还没有定下对自己的处罚,但即使是最轻的革职,王小五也不愿承受这个后果。

赌一把,反正左右都是个死。王小五心一横,对着外面大叫道:“我要见将军!我有一条好计策,能为将军赚大钱!“

CC BY-NC-ND 4.0 授权