数位内容身份证:从ISBN 到ISCN
一年一度的香港书展刚刚闭幕,这次且让我们聊聊书本。
稍微看过书的大概都会见过国际书号ISBN,一般印在封底那个条码。但ISBN 为什么需要存在,大概不是每个人都想过。不妨先考考自己:一叠有封面、有名字、钉装好,满载围绕特定主题文字的纸,没有ISBN 的话,算是一本书吗?
ISBN 与metadata
是,但也不是。视乎语境。
当书泛指文字、图片、概念的载体,那可以说是,比如动漫爱好者的同人志一般都不会有ISBN。但在出版社、印刷厂、书店、图书馆、贸易发展局等等,即体制的眼中,那只是一叠纸,不是书。图书馆不会上架,发行商不会推广,书店很可能不会进货或者根本不知道它的存在;甚至,在某些威权国家,书店出售「一叠纸」很可能违法——别怪我口吻不太确定,那可是因为威权国家的法律诠释完全随意。换言之,威权政府透过ISBN 的批核,就能轻松牢牢审查学校、图书馆、书店、报摊等地方流通的内容。
当然,ISBN 有其积极、正面的意义,而且在很多民主国家,以及曾经享有高度出版自由的香港,申请ISBN 都是近乎没有门槛的。试想像,要不是1967 年启用的国际书号,我们根本没法得知整个世界的书目。 ISBN 是书本的metadata(元资料),让全人类得以搜寻、发现书目,让知识有效传达,作品相互引用。
metadata 可以理解为「data about data」:书是data,ISBN 是metadata;电影是data,IMDb 上的各项周边资料是metadata;可见元资料对资料整理和发现的重要性。
对于metadata 有个常见的误解:只要有data 就能抓出metadata。实际上,能从data 抽取的metadata,一般只占少数,很多进阶的metadata 需要额外花工夫整理,从IMDb 就可看出,即使Google 和最先进的AI 都没法从电影里面抽取出那些包括票房、制作经费、花絮、时代背景等各种metadata。
数位内容与ISCN
来到网络世界,整理知识、发现内容的角色很大程度由Google 担当,表面上我们好像不需要metadata,有关键字就好,实际上,关键字正正就是metadata 的一种。而想要内容在搜索结果名列前茅,单单让Google 分析网页内容抽取关键字还不够,还需要主动整理和提交更细致的metadata,具体体现为JSON-LD 格式的structured data(如嫌火星文,请忽略这句)。
〈 RTHK 影片备份:无需硬盘,但要共识〉和<meta charset="utf-8">〈 dAppledaily 永久储存苹果日报,永远几远? <meta charset="utf-8">〉介绍的IPFS 和Arweave,目标是永续储存data;至于负责永续储存metadata 的,则是借用ISBN 概念而设计的ISCN,International Standard Content Number 。
当然,不是任何内容都值得永续储存,事实上,不值得的占了大多数,比如即时通讯,我全都会设成自焚,以求数位环保。但对于少部分珍贵内容如一本用心写成的书、一篇深刻的文章、一张经典的照片、一幅隽永的插画,都值得永远流传,避免因为平台倒闭、费用过期、人为错误、政治审查等各种原因流失。
要做到这一点,采用的工具除了IPFS 和Arweave,也该加上ISCN,否则假如不被搜寻、发现、引用、交互,data 即使永续存放也没太大意义。
ISCN 就像是区块链年代的ISBN,但从物理世界搬到网络,从只应用于书本改为应用到小至一篇文章、一张照片、一首歌曲,大至一部小说、一段影片甚至一出电影的任何数位内容,从由各个国家政府负责当地号段的批核,变成不设任何「入闸机制」,所有人付出小量LikeCoin 就可生成的「permissionless」机制。这种无需核准的模式,是无大台机制的核心原则,放诸金融,带来的是DeFi;放诸内容,带来的将是DePub,无大台出版。
无大台出版赋予了个体出版自由,那虚假讯息、内容农场等诸多问题该如何处理?请留意往后我们对DAO ,decentralized autonomous organization 的讨论。
我是《区块链社会学》的作者高重建,斜杠写作/教学/创业,探讨出版自由、财务自由和民主自由,作品每周五发表于#decentralizehk周刊。
这些文章全面公开,旨在普及知识;如果你相信有价值,别惩罚开放,鼓励封闭,请付费订阅,支持我一直做下去。
[课金支持]
喜欢我的作品吗?别忘了给予支持与赞赏,让我知道在创作的路上有你陪伴,一起延续这份热忱!
- 来自作者
- 相关推荐