此为历史版本和 IPFS 入口查阅区,回到作品页
kotri
IPFS 指纹 这是什么

作品指纹

这是淘宝的胜利,还是统计学的胜利

kotri
·

之前淘宝双十一的时候,曾经流传一张图,声称天猫销量造假。

过不了多久,淘宝出来辟谣——但是没什么用,毕竟某个著名的网球运动员也说过,数据是不会说谎的。

里面的数字都是可以考证的,人人都可以用Excel画出简单的三次图线,的确完美拟合。

甚至,2019年的销售数据是2684亿,完美落在预测的区间内。


放在这个例子里,我们可以很简单的认为,淘宝作假了。

于是,我们安心了,可以不相信他们的数据,即使自己在双十一什么也没买,也不用怕拖人们的后腿。


但是,换个角度想想看,假如淘宝没有作假呢?

假如人类的行为真就能被一条三次曲线完美预测了呢?


要知道,统计学应用是十分广泛的,现在流行的机器学习,人工智能,基础就是统计学。

三次曲线的模型自然是太简单了,因此机器学习里应用了更高级的技术,所谓的神经网络。

它和普通统计学的区别就是,十分复杂,复杂到能够拟合任何的数据,只要有足够好的显卡和足够长的训练时间。


任何的数据,当然也包括人类行为的数据。比如,Youtube,知乎,淘宝自己,都应用了机器学习的算法,根据你过去的行为,推荐新的内容、新的广告、新的商品。

而预测结果是,非常成功。


人工智能可以比你自己还懂你自己。

Youtube推荐的真就是你想看的,知乎首页出现的文章真就是你感兴趣的,淘宝刷出来的商品,你毫不犹豫地扫码付钱。

到最后,你甚至不需要自己去搜索,自己去辨别,你想要的伸手即得,只需要点进视频,观看,然后手机下滑,进入下一个你最喜欢的视频,如此循环。


或许神经网络确实比三次曲线更加复杂。但是,那有什么区别?他们这次,真的做到了。

这次,他们真的没有造假,它们超越了人类,预测了人类自己的行为。

都说人工智能足够发达之后,会控制人类,代替人类。谁知道,人工智能还没发达起来,人类就已经被操控了。


人类的自由意志比不上算法的诱惑。人们每天沉迷手机,不可自拔。刷完一个视频又一个视频,买完一个商品又一个商品。

网站背后,是人类在编写算法。网站前台,就像是算法在训练人类。

说到底,人类到底是什么?既然人类也是一种神经网络,是否人类也不过是个算法,是个统计模型?甚至,整个地球就是一个巨大的统计模型,人类和电脑都不过是其中的一部分而已?

假如存在一个统计模型,能够精确的预测一个人的所有行为,那么,人的所谓自由意志,不就只是人类自欺欺人的谎言?


后话——统计学有个概念,叫做自由度。所谓统计模型,即是用低自由度的公式模拟高维度的数据。

每次建立模型,都只保留一部分的自由度,其他的作为模型误差,被抛弃。也即是说,统计学每建立一个模型,世界上的的自由度就降低一点。

——“人工智能诞生的两百年后,人类社会的统计自由度终于降为了零。”

CC BY-NC-ND 2.0 授权