Revision history and IPFS entry, back to latest
Ubikium
IPFS What is this

Content Hash

Solid 与互联网的再去中心化

Ubikium
·
·

摘要

万维网的发明者, Tim Berners-Lee ,发起了一个新的项目,旨在将互联网重新去中心化(re-decentralize)。

互联网作为现代生活的一个核心组成部分,任何技术上的特性都影响着使用者的体验,进而形成一种意识形态上的规范。去中心化本身,并非互联网所必须具有的特性。实际上,随着 Web 2.0 与移动互联网的发展,互联网的中心化程度越来越高,普通用户所能取得的剩余(surplus)也越来越少。作为回应,许多新技术都以互联网的再去中心化为目标。 Solid 项目正是对账户与数据所有权的一种重新阐释。但这样的尝试,与大公司所塑造的互联网形态相冲突,因而发展缓慢。在争夺互联网所有权的过程中,唤醒公众意识是最重要的一步。本文将介绍 Solid 项目的发起原因和现状,夹杂一些评论。

电子邮件与换手机

更换手机可能是整个「智能手机」的体验中,最不智能的一部分了。通讯录的备份和还原比较容易。应用列表稍微难一点。跨越苹果/安卓界限的,如果没有两种版本,只能找到功能上的替代品。应用数据更令人头疼。通过账户管理数据的应用,可以从服务器端取回。没提供的话,就得自己想办法了。同一厂家的手机可能提供「手机克隆」,传输一些常见应用的数据。假如是一个小众软件的话,只能依靠软件自身的备份和导入功能,而提供这样功能的软件少之又少。

这样看来,通过账户管理数据的应用的确更方便。但这种便利不是没有代价的。首先,账户提供了一种方便追踪(tracking)数据的方式。其次,比如微信一类的应用,即使有账户功能,也并不提供数据存储。最后,还有一些应用,数据的同步与备份需要额外付费。

以上的这些,只是使用相同的软件所遇到的困难。如果是不同的软件呢?

想要和不同平台上的好友交流,因此需要安装好几个社交网络软件。一个音乐软件上的歌单无法转到另一个音乐软件上,导致后者的推荐完全不对胃口。在一个地图软件上保存的地点,还需要在另一个上面重新标记一次。

所有的这些,可能有人觉得十分厌烦,而大部分已经习以为常。移动互联网,本来就应该是这样的,不是吗?

齐泽克在『暴力』中指出,意识形态最纯粹的形式,就是没有意识形态 (Žižek, 2008) 。也就是说,当一种意识形态已经占据如此主导的位置,人们也就很难将其当作一种特定的意识形态,而认为事情本来就应如此。意识不到存在,也就无法进行思考。这一点,在技术上体现得尤为明显。技术,常常被当为一种意识形态中立的工具。使用软件的人,常常忘记软件也是人所写。软件的运行方式,也是人的发明,而非自然而然。技术中立论,不仅忽视了技术产生的历史背景,也忽视了影响技术发展的一个重要因素:路径依赖。想说明这一点,只需要思考一下,以上所描述的移动互联网的使用场景,的确必然如此么?

实际上,有一种移动互联网的应用,其使用方式就完全不同——电子邮件。更换手机时,电子邮件完全不会产生问题。因为任何一个客户端,都可以登录任何一个邮箱账号。在同一个手机上换用不同的客户端,无论是联系人还是邮件,也都可以自动同步。你可以在一个邮箱中收另一个邮箱中的邮件,可以让一个邮箱转发给另一个邮箱,甚至可以完全将一个邮件中的数据全部转存到另一个邮箱中。将电子邮箱评为整个移动互联网中的最佳应用,我想没有人会持反对意见。

不过,只有一个小问题。那就是,电子邮箱并不是移动互联网应用。早在智能手机发明之前,电子邮件就已经开始乘着电流跨越网络了。这正是电子邮件体验之好的原因。互联网发展至今,反而在其最早的应用之一上找到了最佳的体验。从中引发的思考,将帮助你理解万维网发明者 Tim Berners-Lee 的 Solid 项目的目标。

问题出在哪

简单来讲,问题的关键是账户。不妨首先思考一下,什么是账户?为什么需要账户?

最初的账户,是一个人在数字空间中的化身,起到身份标识的作用。最简单的账户就是昵称(nickname)。很多人的昵称不同于真实姓名,表明了现实空间和数字空间身份的区别。而在不同的平台上,却倾向于使用相同的昵称,这样的昵称也被称为「把手」(handler),体现了同一身份在不同应用空间中的连贯性。早期的 IRC 与 BBS 一类的应用中,账户无非是通过密码保护的,对某个名字的使用权。

现代账户的兴起,则伴随着 Web 2.0 时代的到来。不同于早期的静态网站, Web 2.0 时代的网站最大的特点就是动态性。不同的用户访问相同的地址,可以获得不同的内容。个性化的定制,带来了新的商业模式。为了实现个性化,服务器需要区分不同的用户,并记住之前的交互的能力。因此,状态(state)被首次引入万维网。最早维持状态的技术是 Cookie 。但 Cookie 实际上让服务器记住的是与机器的交互,而不是与人的交互。因此,当多个人使用同一台机器,或者一个人使用多台机器时, Cookie 就力不能及了。

在这种背景下,现代账户被设计出来,用以帮助服务器区分不同的用户。实现的方法是,使用一种与个人有着很强对应性的标识。通常而言,指的是手机号或电子邮件。不难看出,假如通过同一邮箱能登录的账户都算作一个账户的话,相信大多数人的账户数目并不多。

这种账户的出现方便了数据的迁移。只要保证服务器可以清楚无误地区分用户,那么所有的数据都可以储存在服务器端。需要时再传输到本地。本地只保存一份缓存(cache)用以加速,但并非必要。数据备份的唯一限制是服务器端的存储能力和网络的传输速度。从早期只有几兆的邮箱,到现在能将整个手机数据备份的云服务,技术上十分相似。

但这并不是故事的全部。互联网公司逐渐发现了账户的另一个用处:获取用户的数据。为何要获取数据呢?因为数据本身就具有价值。

作为一个购物网站,知道哪个商品被浏览得多固然很有价值,但知道被**谁**浏览得多,也许更有价值。一个简单的例子可以说明个性化推荐所能带来的收益。假如购物网站有一个广告位。一个奶粉公司和一个漫画公司,都想竞争这一广告位,分别出价 110 元和 100 元。按次价拍卖原则,最终奶粉公司以 100 元获得了这一广告位。但后来购物网站发现,其用户由两部分构成,一部分是刚有孩子的父母,另一部分是青少年。由于即使向青少年展示奶粉广告,也很难卖出奶粉;同理,向父母展示漫画也相当于浪费。此时,购物网站可以仅向父母展示奶粉广告,仅向青少年展示漫画广告,分别收费 60 元。

前后对比,同样的广告位,由于进行了个性化广告,购物网站多收入 60 * 2 - 100 = 20 元。奶粉广告商节省了 100 - 60 = 40 元。漫画广告商也以低于预期的价格获得了投放广告的机会。而用户也能看到和自己相关,也就是更贴近需求的广告。难道不是完美的共赢么?

问题在于最后一点,什么是「贴近需求」的广告?这一说法是自相矛盾的。因为真正的需求,不需要广告来创造。即使没有广告,父母也会为了满足自己的需求而选购奶粉。广告的要点不是善意地提醒父母该买奶粉了,而是「劝说」父母买这个品牌的奶粉,而不是另一个品牌。事实上,可能另一个品牌的奶粉更符合父母的需求。

同样的道理也可以用于促进数据的生产本身。比如 Facebook 发现,假如让用户愤怒的话,用户的使用频率就会提高,因此就可以获得更多投放广告的机会。这样的算法奖励推荐使其愤怒的内容,而又有什么内容比政治观点相反的假新闻更能让用户愤怒呢?相似推荐、自动播放,这些都是希望用户永远留在平台上的努力。 Netflix 直言不讳地指出,自己最大的竞争者是人类的自然睡眠

广告、上瘾机制,说到底并不是满足用户已有的需求,而是「说服」用户,让他们相信自己具有一些原来没有的需求,是利用心理学上的弱点,对理性思考做出的干扰与攻击,从而利用用户实现自己的利益。

其中最重要的环节,就是通过账户对用户的数据进行管理。管理,不仅仅是储存,还要分析,并加以利用。这不难发现,移动互联网时代的大公司,无一不是以此作为商业模型的

对这一点的分析,其实并不少见。从电视时代就流传下来的对三方市场的描述:使用免费服务时,你自己就是产品(if you're not paying for it, you become the product)。只是随着技术的发展,注意力经济的规模和能力已经远超从前了。在中文互联网上,有一个更简洁的说法:流量变现。因此仔细思考下,便不难发现,用户使用产品实际上是在进行劳动。生产的产品就是数据。这些数据被用来进行个性化广告投放,或者增加使用时间,从而增加广告位。

电子邮件有何不同呢?

电子邮箱地址的构成格式是「用户名@服务器名」,比如 username@example.com 。一般的应用中,仅仅写用户名,比如只有「 Facebook 上的 username 」这样的说法,没有 username@facebook 这样的格式。在 Twitter 上,仅用 @username 来标志这是一个用户名。

显式写出主机名,也就意味着同一个客户端可以处理不同服务器上的用户,同时也意味着,服务器放弃对客户端选择的控制。相比较之下,想使用 Facebook 的服务器,就必须使用 Facebook 的客户端(网页或者应用)。

电子邮件用户的数据保存在服务器上,而与客户端解耦。服务器之间、服务器与客户端之间,遵循公开的邮件交换协议(比如 SMTP,POP3)。而从来没有听说过公开的「微信协议」,或者「Facebook协议」。

互联网公司正是通过内部的秘密协议,实现了对整个服务过程的垄断。用户无法看到那些数据被收集、传输、使用,自然也无法管理。

一切具有网络效应的服务,也具有天然垄断性。所谓网络效应,就是指一个产品对用户的价值,部分取决于使用这一产品的用户数量。一个苹果对我的价值,并不因为有成千上万人吃同样的苹果而增加,但成千上万的人和我使用相同的苹果手机,则会提高苹果手机的价值。因为这一规模会吸引更多开发者在这一平台上进行开发。与之相对的,只有一个用户的社交软件毫无价值。

具有天然垄断性的产品均应作为公共服务提供。比如自来水,一个人并不想在家里装五套自来水系统,每天看看水价、水质,让它们竞争。相反,自来水作为一项公共服务,由一个服务提供商取得合法的垄断地位,相应地,这样的服务不能以利润为目标。

社交网络同样具有网络效应,因此同样具有天然垄断性,为何无法作为公共服务呢?

事实上,完全可以。

Solid 的回应

去中心化并不意味着像自来水一样,用政府认证的服务提供商,而是由许多个人所组成的网络。所谓 Solid 就是将以上所说的应用数据与客户端相分离。每个人选择自己的数据服务器,在 Solid 中称为 Pod 。相当于邮件中的服务器地址。这里储存了结构化的各种应用数据。比如既可以供 Twitter 使用的讯息,也可以供微博使用的信息;既可以供微信使用的好友关系,也可以供 Telegram 使用的好友关系。

Solid 应用,则相当于邮件客户端。你可以使用 Solid 账户(在 Solid 术语中称为 WebID)登录任何一个客户端,比如 Twitter 。在登录时,你可以选择提供什么数据给 Twitter ,比如哪些好友关系,是否允许读取每条讯息的地理信息等等。还可以定制使用方式,比如是否可以用于个性化广告,假如使用的话,是否需要向数据拥有者付费。离开一项服务时,是否允许保留数据,还是必须删除。

每当 Twitter 产生了一条新的数据,比如新增了一个好友。这项信息就被传回到 Pod 上,加入了你的数据当中。这样,在切换客户端的时候,你就可以自动将其导入到另一个应用当中了。

除了与应用解耦,自己控制数据还可以提供更多管理的可能。你可以查看自己产生了哪些数据,删除不想要的数据,甚至出售数据盈利。

对于开发者来说, Solid 的愿景也十分美好。只要遵循数据标准,就可以开发应用。不同品牌健康管理硬件(手环、血压计、体重秤等等)所产生的数据,可以供各种不同的软件使用。你甚至可以开发自己想要的软件,来满足自己的需求。

你可以从这篇报道中,看到一个个人数据管理页面可能样子。

障碍在哪

Solid 的愿景如此美好,以至于被认为具有重塑互联网的潜力。但自提出以来,响应寥寥。没有任何一款主流应用提供 WebID 的登录方式,即使在开发者当中,也并没有热度。r/SOLID 只有不到两千订阅者,而项目的 GitHub 页面大多数仓库不超过 100 颗星。不用说重塑互联网, Solid 本身在互联网上的存在感就已经很薄弱了。

为何如此呢?同样是 Tim Berners-Lee ,同样是一个简单而有力的想法。一个引起了信息时代革命,另一个却几乎无人问津。

答案在于提出时的社会环境。万维网提出时,互联网主要是军方和研究机构中交换数据设施。因此,一群技术爱好者可以根据自己的理想主义,使用技术塑造网络的形态,而这一形态也因路径依赖留存到现在,形成了万维网的开放特性。电子邮件也同理。

但到了现在,当公司已经走到了技术的前沿时,它们决定不再犯这样的错误了。它们做足准备,全力把控准入门槛,形成封闭的围墙花园生态,阻止自己的用户使用任何其他的服务。而且很大程度上来讲,它们的确成功了。

这种成功,不仅体现在技术上,还体现在改变了人们对互联网的整个认知。产生这一效果的,同样是路径依赖。试想只能向别的 Gmail 用户发送邮件的 Gmail 账号有多少价值?但人们却并不觉得一条只能让其他 Twitter 用户看到的信息是个问题。

这一认知的改变,形成了互联网去中心化的最大障碍,而且这种障碍还会自我加强。Snowden 在『永久记录』(Permanant Record)中分享了对最初的互联网的美好回忆。但在现在这种互联网形态下成长的一代,却觉得理所当然。

Solid 项目的关键在于制定一套应用中立的标准,这在技术上并不是难题。 Tim Berners-Lee 及其他研究者,已经在 semantic network 上进行了大量研究。其结果与 Solid 的数据语义一脉相承。实际上, Solid 项目的数据格式基础就是 RDF (Resource Description Framework)。

但问题是,有哪家公司愿意接受这样的标准呢?对大公司而言,接受标准就相当于让渡了自己的垄断地位。而对初创公司而言,是选择支持有上亿用户的 Facebook 登录,还是选择支持连开发者都没听说过几个的 WebID 登录方式呢?现在每一个初创公司,如果不是想着被大公司收购,就是想着自己也能成为下一个大公司?有哪个愿意接受自己仅仅成为一个去中心化的公共服务者呢?

因此,想让公司自上而下接受 Solid,我认为已经是一场必败之战了。重新分布化互联网,靠的只能是自下而上的方式。也就是由大量用户所组成的内容网络,倒逼互联网公司加入开放的生态。最终实现的形态,未见得是 Solid 。其他的 P2P 网络,靠各自的特性吸引着用户,完全有可能成为塑造未来互联网形态的重要一环。比如洋葱网络的匿名属性,区块链的分布式不可更改属性,还有其上加密货币的货币属性等等。

怎么办

如果你同样被再去中心化的互联网的愿景所打动,想要有所行动的话,以下几点可供参考。

最直接的当然是进行技术贡献。开放的标准依赖的是开放的技术,由 general intellect 做基础,再贡献回 general intellect。

作为具有网络效应的产品,另一种支持的方式就是使用。选择开放的应用,选择去中心化的应用,至少在 Matters 的用户中,这点共识不成问题。

另外一点也很重要,那就是扩大使用,也就是面向公众宣传。当然,这也就是我正在做的事情。其中最艰难的一步是让公众意识到现有互联网形态的问题。当一个人能够清晰思考时,结论也就自然而然。

在宣传的过程中,尤其是 liberals ,喜欢使用「隐私」(privacy)这一说法。技术语境下,「隐私」指的是对数据公开程度的控制,而不是数据公开这一行为本身。一个注重隐私的人,也会积极分享数据,只要分享的方式受自己控制即可。而「隐私」这个词,常常被认为是反对任何形式的数据分享,因而并不被人重视。「用数据换便利,有什么不对?」问题在于,这一交换是否是自己的明确选择,还是受公司欺骗,或者处于垄断地位下不得已而为止的选择呢?同样的结果,两种方式的道德含义完全不同。

结论

本文介绍了现有移动互联网的问题,并介绍了 Solid 项目的动机,愿景和现状。从中可以看到,互联网的再去中心化对于公众利益至关重要。而实现的方式,依赖于唤醒公众对于数据的新认知。路径依赖曾经创造了开放的万维网,同时也实现了中心化的、封闭的移动互联网。下一代互联网的形态,将由现有的技术决定。争取数据权力的努力,需要更多人的参与。

参考资料

Žižek, S. (2008). Violence: Six sideways reflections.

https://www.ted.com/talks/tim_berners_lee_the_next_web

https://solidproject.org/

CC BY-NC-ND 2.0