Revision history and IPFS entry, back to latest
ckxpress
IPFS What is this

Content Hash

陳冠希教你內容備份五大難題

ckxpress
·
·
但凡在 Matters 消失一陣子,要麼就是處理不了工作量,要麼就是管理不好情緒。反正,從六月初消失到現在的我回來了。抱歉有些留言已讀沒回。會把過去六七周的文章補回。這篇的標題才輕佻一點點,居然就讓我有點慚愧了。其實,如果標題黨可以換來多幾個人閱讀認真的內容,應該值得妥協吧,我是這樣告訴自己的。p.s. 感謝 Matters 增加了 CC 版權聲明,但能否有更全面的選擇呢?如 CC-BY 等。

私下跟朋友解釋 decentralized publishing #DePub,我通常會用某個非常政治不正確的例子;但偶爾記者訪問,為免嚇跑對方,我不敢說。這個最為政治不正確的例子,反而最不政治,況且我也沒想到更能讓人理解備份的例子,現在乾脆沿用:陳冠希的創作。

很諷刺但恐怕是事實:香港史上最大規模的民間備份內容行動,遠早於蘋果日報被處決,是陳冠希的硬盤

以下,我以陳冠希創作為例,帶出民間內容備份所面對的五大難題。

五大難題

一、誘因

雖然無憑無據,但我敢說,陳冠希的創作,即使 13 年後的今天,民間依然有大量備份。只要有足夠誘因,從來就不用擔心某筆內容會從這個世界徹底消失。反過來說,誘因正是首道難題:

當內容本身不夠吸睛,需要提供誘因讓人備份,因為儲存數據花錢花力氣。

二、搜索

可是,即是很多人儲存著,如果有人想看(好吧,就當是我),該去哪裡找?畢竟出於法律責任和其他考慮,這些備份往往私藏。這帶出難題二,搜索:

即使內容沒徹底消失,也需要有方法把內容搜索出來,否則存了幾乎等於沒存。

三、完整性(completeness)

好了,我在 WhatsApp group 四出問朋友後,好幾個朋友發來珍藏。然而,他們的庫存都有點不一樣,有些互相重複,又有些是特定朋友才有,而且格式、解像度都不一致。這帶出難題三,完整性:

要完整備份,除了內容本體(data),也需要索引和原資料(metadata)。

比如,書籍是內容本體,國際書號(ISBN)是索引和原資料。缺乏了後者,就難以書庫是否完整。

此外,索引也有助備份工作的協調,讓參與者得知哪些已經有人儲存,大家用的是甚麼格式之類。

四、正確性(integrity)

得到來自各方的照片後,我發現有些照片十分相似,卻又有些微不一樣,懷疑是朋友 PS 過,把主角改為自己(我睇咗啲咩!?)。這是難題四:

多年後翻看內容備份,我們難以證明內容有否被動過手腳。

別說是多年後,某些事件,政權當天已經急不及待著手竄改了。

五、道德

事後,朋友良心發現,後悔備份內容又提供給我,二次加害事件的主角。這是最後也最不能以技術解決的難題:

內容備份可以保存人類珍貴歷史,也可以帶來傷害,甚至害死人。

一般來說,影響公眾利益或者作者本身主張公開的內容,才適合由公眾備份。

釐清問題 再找答案

五大難題加起來,對於最近參與備份蘋果日報的大眾似乎是冷水一盤。幸好,除了難題五,其餘四點,區塊鏈以及其他技術或多或少能解決。

本文先透過大家熟悉的事件,定義清楚內容備份牽涉到的幾道難題,否則如果連問題都沒搞清楚,接下來關於如何解決上述問題的文章,就很難讀懂了。

CC BY-NC-ND 2.0