不要以為在數(shù)字時(shí)代記錄歷史會(huì)變得易如反掌。N多年后,歷史學(xué)家會(huì)為如何破解和讀取今天留下的“古董級(jí)”數(shù)碼資料而大傷腦筋。
這個(gè)世界正在失去重構(gòu)歷史的能力。
假定你身處2035年,是一名歷史學(xué)家,正在想辦法了解2012年的美國(guó)大選。那些充斥著各種新聞和評(píng)論的網(wǎng)站和博客早已消亡不見(jiàn)。電子格式存儲(chǔ)的數(shù)據(jù)也“腐爛”了——從早年的數(shù)字時(shí)代流傳下來(lái)的很多軟盤都已不能讀取。如果你足夠幸運(yùn),也許可以在公共圖書館找到大選資料、電子郵件和其他文件(包括解密的官方檔案)的副本。
但是你能讀取它們嗎?就在現(xiàn)在,美國(guó)宇航局就已丟失了它的許多早期登月數(shù)據(jù),而究其原因,不過(guò)是那些用來(lái)讀取磁帶的機(jī)器報(bào)廢后再也造不出來(lái)了。有著先見(jiàn)之明的圖書管理員也許會(huì)保留幾臺(tái)還能使用的古董計(jì)算機(jī),以便讀取CD和USB存儲(chǔ)器一類的古老技術(shù)。但這顯然還遠(yuǎn)遠(yuǎn)不夠。沒(méi)有了借以打開它們的軟件,計(jì)算機(jī)文件不過(guò)是一堆廢品。
解決方法之一是把所有資料都打印出來(lái)。如果使用耐用的無(wú)酸紙,它們的壽命至少可以與中世紀(jì)的牛皮紙手稿相媲美。但是打印版的數(shù)字資料算不得上優(yōu)之選。元數(shù)據(jù)隨之丟失,文件也就此變得索然無(wú)味了:電子郵件總要串放在一起才會(huì)有趣味,沒(méi)有人會(huì)想讀厚厚的一沓紙。只有當(dāng)數(shù)據(jù)是以數(shù)字形式存在時(shí),才能對(duì)它們進(jìn)行篩選和計(jì)算。
一些有良知的機(jī)構(gòu)已著手開展了部分網(wǎng)頁(yè)、電子書和其他數(shù)字資料的備份工作,并且每隔5年就會(huì)把這些數(shù)據(jù)轉(zhuǎn)移到新的硬件中。當(dāng)軟件變得過(guò)時(shí)后,圖書館和企業(yè)還可以造出模擬機(jī)——在新的硬件中運(yùn)行舊版操作系統(tǒng)。
但是這一努力卻受到了法規(guī)的制約,讓本就困難重重的數(shù)字制品歸檔工作變得愈發(fā)艱難。比如在美國(guó),規(guī)避出版商所依附的反盜版數(shù)字版權(quán)管理軟件(DRM)是一種刑事犯罪。一旦這種軟件不復(fù)存在了,就永遠(yuǎn)打不開這些資料了。在2010年,美國(guó)版權(quán)局作出規(guī)定,除非特別要求,只從事在線業(yè)務(wù)的出版商可以不再向國(guó)會(huì)圖書館提交產(chǎn)品副本。國(guó)家圖書館有權(quán)取得任何在美國(guó)領(lǐng)土上出版的印刷書籍的副本(并且還得到了數(shù)量巨大的其他文件)。但是他們卻不能強(qiáng)行收集軟件或智能手機(jī)應(yīng)用,而一旦離開了這些軟件和應(yīng)用,海量的電子數(shù)據(jù)不過(guò)是一堆經(jīng)過(guò)加密的亂碼。
監(jiān)管機(jī)構(gòu)已經(jīng)認(rèn)識(shí)到這一問(wèn)題。美國(guó)版權(quán)局將在5月初舉行聽證會(huì),討論解除對(duì)于規(guī)避DRM的禁令。在英國(guó),政府則希望強(qiáng)行要求包括軟件提供商在內(nèi)的出版商,在發(fā)布所有產(chǎn)品的最終版本后一個(gè)月內(nèi),向大英圖書館提交一份產(chǎn)品副本。這項(xiàng)提議中的法案將允許圖書館獲取隱藏在付費(fèi)壁壘和登錄要求之后的網(wǎng)頁(yè)和資料。只提供視頻和音樂(lè)的社交網(wǎng)絡(luò)和網(wǎng)站則不在此列。
然而,出版商抱怨這樣的做法成本高昂,特別是在當(dāng)今這個(gè)全行業(yè)都在掙扎求存的時(shí)代。他們擔(dān)心圖書館的訪問(wèn)量會(huì)對(duì)產(chǎn)品的銷售帶來(lái)沖擊,并且提供產(chǎn)品的可復(fù)制版本也將鼓勵(lì)盜版。
這些抱怨看似有些言過(guò)其實(shí)。圖書館不會(huì)把數(shù)字資料提供給所有人,只有那些身處圖書館內(nèi)的用戶才能獲得訪問(wèn)權(quán)。擬議中的英國(guó)法律甚至允許出版商提出請(qǐng)求,為他們的產(chǎn)品設(shè)置長(zhǎng)達(dá)3年的保密期——這樣的讓步極少出現(xiàn)在印刷資料上。幾個(gè)世紀(jì)以來(lái),圖書館一直都在向公眾開放那些最昂貴的書籍和期刊的訪問(wèn)權(quán)。這一原則即使在數(shù)字時(shí)代也值得保留。
賭注是高昂的。30年前的錯(cuò)誤意味著數(shù)字時(shí)代早期的許多資料對(duì)于歷史學(xué)家而言,已經(jīng)變成了一本合上的書(甚至連書都沒(méi)有)。如果圖書館不能獲得更廣泛的授權(quán),取得數(shù)字資料以及讀取它們的軟件,身處未來(lái)的歷史學(xué)家就將無(wú)法重構(gòu)我們的時(shí)代。他們甚至可能不知道自己丟失了什么。
(李中一摘自《青年參考》)