这是淘宝的胜利,还是统计学的胜利
之前淘宝双十一的时候,曾经流传一张图,声称天猫销量造假。
过不了多久,淘宝出来辟谣——但是没什么用,毕竟某个著名的网球运动员也说过,数据是不会说谎的。
里面的数字都是可以考证的,人人都可以用Excel画出简单的三次图线,的确完美拟合。
甚至,2019年的销售数据是2684亿,完美落在预测的区间内。
放在这个例子里,我们可以很简单的认为,淘宝作假了。
于是,我们安心了,可以不相信他们的数据,即使自己在双十一什么也没买,也不用怕拖人们的后腿。
但是,换个角度想想看,假如淘宝没有作假呢?
假如人类的行为真就能被一条三次曲线完美预测了呢?
要知道,统计学应用是十分广泛的,现在流行的机器学习,人工智能,基础就是统计学。
三次曲线的模型自然是太简单了,因此机器学习里应用了更高级的技术,所谓的神经网络。
它和普通统计学的区别就是,十分复杂,复杂到能够拟合任何的数据,只要有足够好的显卡和足够长的训练时间。
任何的数据,当然也包括人类行为的数据。比如,Youtube,知乎,淘宝自己,都应用了机器学习的算法,根据你过去的行为,推荐新的内容、新的广告、新的商品。
而预测结果是,非常成功。
人工智能可以比你自己还懂你自己。
Youtube推荐的真就是你想看的,知乎首页出现的文章真就是你感兴趣的,淘宝刷出来的商品,你毫不犹豫地扫码付钱。
到最后,你甚至不需要自己去搜索,自己去辨别,你想要的伸手即得,只需要点进视频,观看,然后手机下滑,进入下一个你最喜欢的视频,如此循环。
或许神经网络确实比三次曲线更加复杂。但是,那有什么区别?他们这次,真的做到了。
这次,他们真的没有造假,它们超越了人类,预测了人类自己的行为。
都说人工智能足够发达之后,会控制人类,代替人类。谁知道,人工智能还没发达起来,人类就已经被操控了。
人类的自由意志比不上算法的诱惑。人们每天沉迷手机,不可自拔。刷完一个视频又一个视频,买完一个商品又一个商品。
网站背后,是人类在编写算法。网站前台,就像是算法在训练人类。
说到底,人类到底是什么?既然人类也是一种神经网络,是否人类也不过是个算法,是个统计模型?甚至,整个地球就是一个巨大的统计模型,人类和电脑都不过是其中的一部分而已?
假如存在一个统计模型,能够精确的预测一个人的所有行为,那么,人的所谓自由意志,不就只是人类自欺欺人的谎言?
后话——统计学有个概念,叫做自由度。所谓统计模型,即是用低自由度的公式模拟高维度的数据。
每次建立模型,都只保留一部分的自由度,其他的作为模型误差,被抛弃。也即是说,统计学每建立一个模型,世界上的的自由度就降低一点。
——“人工智能诞生的两百年后,人类社会的统计自由度终于降为了零。”