文 陳 力
作者系民盟中央文化委員會副主任,國家圖書館副館長
根據權威機構統計,互聯網信息的平均壽命僅為 44至75 天,滅失原因主要有: 網頁內容更新、網站內容重組、網站主辦者消失等等。作為一種“原生性”的信息,互聯網信息除了數字形式之外,基本上沒有其他形式,如果不對互聯網信息進行及時保存,許多具有研究利用價值的信息將會消失,我們將失去未來研究的重要資料,其損失是無法估量和無法彌補的。
當全球進入數字時代以后,互聯網已經成為政府信息發布、教學科研、文化娛樂、人際交流等各個方面最重要的信息交流渠道,互聯網信息已經成為記錄當代歷史最重要的載體,同時也是最重要的國家戰略資源之一。
據中國互聯網信息中心(CNNIC)統計,截止到2013年12月底,我國網站總數320萬個,較去年同期增長52萬個,增長率19.4%,網頁數量為1500億個,比去年同期增長22.2%,我國互聯網信息總量已經超過了5PB的規模,年增量不小于10%。同時,互聯網信息又具有易滅失性。根據權威機構統計,互聯網信息的平均壽命僅為 44至75 天,滅失原因主要有: 網頁內容更新、網站內容重組、網站主辦者消失等等。作為一種“原生性”的信息,互聯網信息除了數字形式之外,基本上沒有其他形式,如果不對互聯網信息進行及時保存,許多具有研究利用價值的信息將會消失,我們將失去未來研究的重要資料,其損失是無法估量和無法彌補的。因此,對這些反映我國社會發展狀況和記錄文化遺產信息的互聯網信息進行存檔保存,是一項刻不容緩的工作。
互聯網信息存檔工作在國際上很早就受到了重視。早在1996年,Internet Archive(簡稱IA)在美國成立。該機構是一個非營利機構,該機構宣稱其目標是實現全世界互聯網信息的收集、保存和永久獲取,為國際性存檔開發技術工具制定標準,鼓勵和支持圖書館、檔案館、文化遺產機構實現互聯網信息的收集和保存。其他一些國家如澳大利亞、新西蘭、英國、法國、德國、瑞典、日本、韓國等也以各自的國家圖書館牽頭,開始了對本國互聯網信息的存檔工作。2003年6月,由來自12個國家機構組成的國際互聯網保存聯盟(IIPC,International Internet Preservation Consortium)正式成立。目前,IIPC成員已經發展為45個。可以看出,世界各國都已經將互聯網信息的長期保存工作提升到了國家戰略的高度。
目前,我國的互聯網信息存檔工作有兩個項目在持續性進行試驗與研究,分別是國家圖書館的WICP項目和北京大學天網實驗室的Web InfoMall項目。其中國家圖書館的WICP項目采用了完整保存網站的存檔方式,覆蓋了50000個政府網站約10萬站次的存檔,以及圍繞大事件進行了80個主題保存,總數據量約30TB;天網采用了只保存文字的存檔方式,保存了容量約30TB,總數約80億張網頁。這兩個項目雖然已經積累了一些人員和技術經驗,但其工作僅僅是試驗性的,覆蓋面也只涉及中文互聯網信息的很少一部分,而對于中國乃至全世界的整個互聯網信息來說僅僅是九牛一毛。同時,在互聯網信息的長期保存方面,還存在著法律、機構、人員、資金等多方面的問題,需要從國家戰略決策層面加以解決。
2013年本人曾向全國政協提交了“關于重視和加強互聯網信息長期保存工作的建議”,在有關部門的答復中,只是提到了要在今后的科技發展規劃中考慮此事。我認為,鑒于目前我國網絡發展迅速,網絡信息與國家安全、民眾生活息息相關,事關重大,刻不容緩。最近,由習近平同志擔任組長的中央網絡安全和信息化領導小組成立,我希望互聯網信息長期保存的問題能夠盡快列入國家有關方面的議事日程。為此建議:
第一,將互聯網信息長期保存工作提高到國家信息發展戰略的高度來加以重視,在政策、法律的層面加以規范和保證。在互聯網信息的采集與保存過程中,會涉及許多與現有著作權法相沖突的問題。為了解決互聯網信息的保存問題,許多國家都以立法的形式將互聯網信息納入“文獻繳送”范圍,例如法國、丹麥、日本等國都先后制定了法律或法案,允許國家圖書館對本國的互聯網信息進行主動采集存檔。為了確保國家層面的互聯網信息的永久保存,我國應建立和完善互聯網信息繳送制度,通過修訂或新設法律法規,把互聯網信息納入法定繳送范圍,授權國家圖書館等特定機構使用特定方法對互聯網信息進行采集和保存,并在法定范圍內向社會提供服務。
第二、盡快建立國家級的互聯網信息保存中心?;ヂ摼W信息保存有著規模大、投入大、復雜度高、持久性強等特點,必須要有一個國家級的機構專門、長期從事此項工作。目前,我國的互聯網信息保存還處于起步階段,還沒有明確專門的機構對整個中文互聯網信息承擔保存負責,勢必導致一些互聯網信息重復采集,造成人力、財力的浪費;同時,大量的互聯網信息因得不到及時采集,造成重要文化遺產的流失。因此,建議盡快建立中國互聯網信息保存中心,制定互聯網信息保存的國家戰略,協調各互聯網信息保存的組織與機構,構建國家互聯網信息的保存協作體系。