毫不利己,专门利人:如何再造一个维基百科?

lishuhang
·
·
IPFS

本文首发于航通社,原创文章未经授权禁止转载。航通社 微信:lifeissohappy 微博:@航通社

书航 6 月 11 日发于北京

在我们熟悉的中国互联网,有不少互联网服务在发展过程中占用了大量的社会资源,需要全体人民为他们付出管理成本,共享单车就是最典型的例子。

另一些则是在发展初期没有顾虑到社会成本问题,最后不得不通过“补课”的方式,弥补自己以前亏欠的社会管理支出,例如字节跳动和 Facebook 都不得不加强了人工审核力量,以治理对产品的滥用行为。

这些都可以称为技术发展中的“负外部性”:原本你情我愿的双方互利的交易过程,对第三方造成了额外影响。具有负外部性的交易会减少全社会拥有的福利。

但是,像维基百科(Wikipedia)以及互联网档案馆(Internet Archive)这样的公益服务,则是在为互联网贡献着公共服务,而自身则因为理念的因素而不计成本地付出。

都在说“科技向善”,维基这样“毫不利己,专门利人”的产品看来是这一目标的顶点,比任何“不作恶”的口号都更有说服力。如何让这样造福社会的“正外部性”产品多一点,再多一点?

橘生淮南则为橘

维基百科是一本“自由的百科全书”,由全球各地无私的编辑者,在一个基本严谨的组织架构下,付出义务劳动贡献而成。其服务器、开发、运维等成本则通过网上捐助覆盖。

据官方介绍 [1] ,维基百科是全球第五大网站,每月为 4.5 亿用户提供服务,页面浏览数以十亿计。不过该网站只有 350 名全职员工,它们通过强调运营的高效率和非营利性向捐助者证明其付出物有所值。


但除了这些员工之外,全球 70000 多名志愿者才是编辑网站内容的主力。每个月,全球用户通过 10 多亿个终端来登陆维基百科获取信息,每分钟维基百科上的内容会被修改 350 次。(2016 年数据 [2])

谷歌在众多搜索结果的右侧,放上了维基百科的解说链接,帮助人们快速了解查询词的含义。作为未来世界的流量入口之一,谷歌语音搜索产品“谷歌助手”(Google Assistant)也大量引用维基百科回答人们“什么是……”之类的问题。

谷歌还在 YouTube 的某些视频下,放上引到维基百科的链接,告知视频是关于某个正进行的新闻动态、历史事件(比如 9/11 恐怖袭击)或来自某国的官方媒体,或得到政府资助等。[3]


这样看来,维基百科在谷歌产品中,起到了百度百科在百度搜索产品中一样的作用。

互联网档案馆保存的内容多种多样,除了 90 年代中期开始的众多全球网站的网页内容之外,也有专门保存 CD-ROM 光盘镜像、旧版主机游戏、电视新闻节目等内容的分区。

站内还有一个专门的分区 [4] 存储了 2001 年 9 月 11-17 日一周内美国境内能接收到的主要电视台,包括世界各国的国家电视台的新闻节目内容,可以带人们重回袭击现场,堪称美国版“爱国主义教育基地”。


不过,互联网档案馆最为人称道的,还是对已经或即将逝去的内容的保存工作。它们在去年 6 月 500px 网站决定删除采取“知识共享”(CC)免费协议的照片时赶着备份了一部分 [5],在去年底 Tumblr 要删除所有色情内容之前也备份了一些 [6]。


曾有媒体质疑,维基百科被谷歌大量使用,但谷歌并没为此充分付费。

不过,谷歌以每年 100 万美元左右的捐赠额度,已经成为对维基媒体基金会贡献最大的捐赠者之一。吉米·威尔士(Jimmy Wales)在接受采访时也表示,它们与谷歌的关系是所有硅谷大公司之中相对最好的。[7]

比这更值钱的是维基百科内容在谷歌搜索结果中的高曝光率。它们基本不需要花钱宣传推广自己,成为保持维基低成本的一个至关重要的因素。

与此类似,互联网档案馆也不必以一己之力负担所有运营费用。2014 年 8 月,该档案馆部分数百万张历史图片迁移到曾在雅虎旗下的图片存储网站 Flickr 保管。[8]

就这样,完全公益性质的互联网服务和手握流量资源的商业巨擘合作,实现了共赢和循环生态。

维基媒体基金会有百科之外的多个项目,其中 WikiData 提供计算机能识别的,结构化的人类知识图谱。[9]


因为目前机器学习还不能按照人类基于逻辑的方法来“思考”,这些知识谱系对于 Alexa 等语音助手产品将非常有用。

可见,下一代互联网入口同样少不了维基的贡献,和与巨头间的互利合作。

生于淮北则为枳

在国内,维基百科的对应产品——百度百科并不能做成一个只需由网友自发维护和捐助,就可以正常运行的环境。

事实上,百度为维持百科的正常运转付出了大量的人力物力,同时也因为是最终责任人,而一直承担着“虚假信息”等监管漏洞的批评。

百度百科的审核员确实由一般网友担任,其中也包括一些从中文维基百科的编辑战中逃离出来的专业编辑。但是,百度必须凭空为这些网友的义务劳动,建设出一套足够强的激励机制。因为,反过来利用平台破坏整个环境的滥用行为,更为屡禁不止。

除了大家都知道的为营利目的修改词条之外,还有一种是先把链接放上百科,在通过修订之后再修改外部链接的网页,使得某些词条的外部链接可以导向色情网站。[10]

百度不得不额外将词条的外部链接,由原先的直链转为网页快照,而由于互联网档案馆在中国不能直接访问,百度也需要自己建设快照库。说白了,就是什么都要自己从头再做一遍,造成了巨大的浪费。

百度还邀请了一些权威机构来为专业词条做把关。然而,即便是在打上了“本词条由‘科普中国’科学百科词条编写与应用工作项目审核”字样的词条当中,仍然可能会出现纰漏。


例如,在百度百科的“希格斯玻色子”词条当中,有一个数值的数据单位发生了错误,但是这个错误始终没有被改正。[11]



同时,百度为了进一步丰富百科的信息,又引用了一些外部内容创作者的短视频,推出了“秒懂百科”栏目。而这些视频的匹配以及版权归属等等,对百度来说又是一个额外的支出。

另一个体现“中国特色”的地方是制作百科类产品的必需资质。由于内容审核的问题突出,另外办下资质和牌照相当困难,使得维基百科上也许可以暂时搁置的一些争议,对百度百科则是不得不面对的,需要付出更大的审核成本才能消除运营风险。

即使如此,百度百科的官方审核力量,与其数量庞大,各怀心思的“贡献者”,以及更广大范围的用户相比,仍是只占很小比例,无法阻止一些低质量内容的留存。而这些内容就像埋藏的地雷一样,不定期会被搜索到的网民发现,并在微博、知乎等地晒出来,顺带加上对百度“作恶”的严厉批评。

我们基本可以将百度百科看作是平行世界里的维基百科,它清晰地证明了假如维基百科是一个商业项目,它实际将付出的成本有多大。

而百度百科的靠山是百度,令它不至于被迫在烧钱中过度扭曲,甚至沦落到彻底关闭,是它更值得庆幸的地方。

国内创投行业长期持续的烧钱,使得大量项目畸形发展,只能先不顾一切的扩张,再回头改错,寻找政策认同。如《中欧商业评论》提到的:[12]

“这种‘先污染、后治理’的发展路线甚至会影响到其他‘中规中矩型’企业的决策。曾经坚持‘小而美’的易到,就是这种竞争环境的‘遗憾品’。”

共同的挑战

即使一个产品在设计之初有着高尚的动机,也应该考虑到使用它的人是千奇百怪,多种多样的,他们可能会怀着各种各样的心思,做出意料之外的举动。

汉堡王“黑入”谷歌助手的故事就成为一个经典案例。2017 年 4 月,汉堡王播放了一则广告,并没有介绍任何产品信息,只是让店员说了一段话:

“你正在看一则 15 秒的汉堡王广告。只不过,在这短短 15 秒内,我们没法向你全面介绍皇堡里所有的食材。但是,我有个办法。OK,Google:什么是皇堡?”


(图片截取自 YouTube)

一旦你家里有了一台谷歌智能音箱 Google Home,那接下来你将会听到它为你朗诵从维基百科“皇堡”词条截取的介绍内容。重点是,为了让 Google Home 的介绍听起来更像广告,汉堡王还偷偷更改了维基百科词条的开头部分。

这条“隔山打牛”的 15 秒广告在被称为 “广告界奥斯卡” 的戛纳广告节上获得评审团大奖,仅次于最高奖金棕榈奖。[13]

这当然不是滥用维基百科对自由编辑的信任的唯一例子。最新的一起似乎更为恶劣。

为了在谷歌图像搜索结果中占据最热门的位置,户外服装公司 The North Face(北面)在维基百科的文章中偷偷植入了广告照片。如果不是它们大张旗鼓地自我宣传,事件可能一直不会被曝光。

The North Face 与李奥贝纳合作,派出摄影师前往世界各地的著名户外地标,拍摄穿着 The North Face 冲锋衣的人们站在地标的照片,并替换到这些地标的维基百科页面。

“一个品牌如何不花钱就在谷歌上出现在第一位呢?” The North Face 自卖自夸,“我们到达了最难企及的地方之一:世界最大搜索引擎的‘顶端’。仅仅通过和维基百科合作,完全不需要支付任何费用。”


事件引发维基媒体基金会和网民的一致谴责,以公司道歉并撤下照片告终。[14]

这种投机取巧的做法与所谓 SEO(搜索引擎优化)非常类似。SEO 的出现,原本是为了让原本做得很好,但苦于难以被发现的网站获得更大的展示机会,但是实际却经常被滥用,使得质量低下的内容呈现在搜索引擎的前列。

类似的事情几乎对每一个心怀纯真善念,把人性想的很美好的创始人都产生过冲击,包括曾开发《风之旅人》(Journey)等传奇游戏的制作人“禅师”陈星汉。

在他凝聚七年心血制作的游戏《Sky光·遇》当中,陈星汉第一次尝试应用内购方式盈利,但大多数内购是为了作弊然后炫耀,不符合他游戏轻松积极的基调。

陈星汉定下的机制是,内购是为了积累礼物并把礼物送给他人,收到的人会获得爱心,再用爱心解锁隐藏服装和道具。结果,很多机制的漏洞被玩家发掘出来。

有人开小号给自己赠送礼物;有人打扮成可爱的小个子,卖萌向陌生人乞讨爱心;还有人坐在聊天椅上,向每个坐下的人兜售爱心交换计划……团队不断调整才控制住了比较健康的生态。[15]

人性的弱点决定了用户与平台之间相互利用,互钻空子的关系不可避免。平台如果有意利用人性,则可能献上让人欲罢不能的推荐算法,用区区小利牢牢拴住用户,那么用户一方几乎没有“胜算”。

但反过来,对于一心向善的平台来说,其它“受过锻炼”的用户反而成了能量更大的破坏者。这一点不分中外皆然,是个世界性的问题。

只是,出自中文互联网土壤的产品,还需要经受一些额外的考验。

难过语言文化关

中文互联网是一个比英文小得多,又严重被割裂的盘子。

当然,这里说中文互联网“小”,只是相对的。一些小语种,甚至是北欧发达国家如冰岛等的母语,在可以用英语的互联网环境减少了使用的机会,都要陷入半消亡的境地了 [16]。但相对的问题,毕竟也是问题。

最大的中文使用地区是中国大陆,拥有一套“自我循环”的系统。而中国大陆以外的其他中文使用地区,则都倾向于为中文维基百科直接作出贡献。也就是说,全世界可能有,且只有一个维基百科,能受到如此大量且长时期的维护。

至于英语,由于使用遍及全世界几乎所有地区,要从全球一百多个地区“掐尖”找到有钱有闲的顶尖人才,无疑容易得多。

在英语非母语的国家当中,能熟练掌握英语的人,一般都拥有比较好的家境和教育条件。他们不太可能为了生计所迫,或者是完全出于恶作剧目的,而去专门做一些破坏社区生态的事情。

众所周知,在国内却有为数不少的人,意图通过破坏一个本来清净的网络环境,目的仅仅是创造自己一点可怜的虚拟存在感和成就感。

雪上加霜的是,中文使用地区之间的教育、文化乃至意识形态区隔,也让中文使用者相对其他语言,都更不容易倾力合作。

维基百科同样面临着编辑战和“巨怪”(troll)的问题,但是这些战争的规模相对有限,在英文版只是集中于少数几个议题,如特朗普和右翼词条。然而,中文维基百科的编辑战自从 2002 年中文版开通以来就没停过。

经历了 2003 年简繁体中文版合并,2004 年推出习惯用词自动转换软件(如把“软件”和“软体”、“互联网”和“网际网路”相互转换,这是早期引发编辑战的重要导火索之一)之后,基于意识形态的编辑战仍不间断,甚至根据维基人自己的记载,吉米·威尔士曾考虑过暂时关闭中文维基百科以促成强制停火。[17]

最终,战况的基本平息还要倚靠中国大陆地区加大了直接访问维基百科的难度。这也让人难以想象,万一国内被拦住的千军万马有了前去“战斗”的机会会怎样……那恐怕会是一场史诗级的全面战争。

百科类产品的例子似乎证明,纯粹“正外部性”的产品确实是存在的,但它的存在可能是偶然的,成功可能是不可复制的,对于“险恶”的中文互联网环境来说,可能尤其缺少借鉴意义。

结论

一个自始至终都实现“正外部性”,创造正向社会价值的公司,首先应该从一开始就聚集着拥有足够多理想主义情怀,发迹之后又不忘初心的人。吉米·威尔士如此,其它成功案例也如此。

其实有理想主义的人,在中国并不缺少,甚至于这些人不用必须出国,才能实现纯正的理想主义。在 GQ 最近一篇写后厂村的报道 [18] 中,提到在百度 7 年的员工陈晓琪。

”几年前,同为互联网高管的朋友卖掉北京的房和车,跑去丽江开客栈。她动了心,也去体验。但过了一周她就待不住了,觉得还是每天看着无人车测试的日子带劲儿,又回到后厂村。“

在国内极端残酷的“黑暗森林”中,像她一样仍然能找到价值寄托的人,很少,但真不是没有。但要想让国内也出现一些不至于过早夭折的公益型互联网产品,至少还需要达到以下几项:

1、应该是一个可以自循环,收支平衡,或者是维护成本极低,在可控范围内的项目。

2、项目实施的过程当中,必然会产生用户不正常使用带来的干扰,这些干扰源于产品设计未曾考虑的缺陷,可能会带来额外的运营成本。因此在估算成本的时候,要留出足够多的提前量。

3、确定自己做的产品是针对中文(或中国大陆)市场还是针对全球市场。中文互联网因为种种特色,比英文互联网更难获取成规模的、合适的用户群,来维持一个公益性产品的运转。

不论如何,产品适用的范围还是要足够广泛,大到可以产生规模效应。毕竟“让几千万人每人掏几块钱”比“让几千人每人掏几万块钱”容易得多。

除了上文提到的部分,还有一些零散的要点,例如尽可能少涉及硬件或实体物品的生产。

产出大量固体垃圾的“创新”不仅是共享单车。《纽约时报》也曾指国内外卖网站的兴起连带产生了大量白色垃圾。不论责任在于平台还是入驻商家,其造成的环境污染的负外部性在所难免。[19]

中国人辩论吵架,一句“你行你上啊”很容易把人说跳。评论食物好坏不用自己做厨子,评论冰箱性能也不需要自己身体能制冷。

但对于一个产品如何在成长壮大过程中,避免产生太大的“负外部性”,这还真是确实属于一个“你不上就不行”的范畴。

人人都知道这样做哪里不对,但设身处地之下,不一定会想到更好的解决办法,还有待后来人继续尝试。

[1] https://donate.wikimedia.org/

[2] https://annual.wikimedia.org/2016/

[3] https://www.cnbc.com/2018/03/13/youtube-wikipedia-links-debunk-conspiracy.html

[4] https://archive.org/details/911

[5] https://www.archiveteam.org/index.php?title=500px

[6] https://www.fastcompany.com/90279321/the-frantic-unprecedented-race-to-save-700000-nsfw-tumblr-for-posterity

[7] https://techcrunch.com/2018/03/24/are-corporations-that-use-wikipedia-giving-back/

[8] http://blog.flickr.net/en/2014/08/29/welcome-the-internet-archive-to-the-commons/

[9] https://www.wired.com/story/inside-the-alexa-friendly-world-of-wikidata/

[10] https://www.cnbeta.com/articles/tech/822909

[11] https://m.huxiu.com/moment/52647.html

[12] https://mp.weixin.qq.com/s/rHVra2qfZFUhuAyowadJDQ

[13] https://www.ifanr.com/859962

[14] https://www.cnbeta.com/articles/tech/852609

[15] https://mp.weixin.qq.com/s/aXJ8asx70hLetdDJyukcSg

[16] https://mp.weixin.qq.com/s/u2eYPP18NzxUnxFZQEb0_Q

[17] https://zh.wikipedia.org/wiki/Wikipedia:坏笑话和删除的胡话/中文维基政治编辑战

[18] https://mp.weixin.qq.com/s/-FrcU0-jb7TqXIzNSlC50w

[19] https://www.weibo.com/ttarticle/p/show?id=2309404377330276557608

欢迎随手转发到朋友圈。寻求转载授权,请先阅读转载须知,然后发邮件给 coop@lishuhang.me 。转载时请保留版权信息。

CC BY-NC-ND 2.0 授权

喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!