馬蕓馨 夏曼秋
(1.安徽大學管理學院,安徽合肥,230601; 2.安徽大學經濟學院,安徽合肥,230601)
社會記憶是一個民族最寶貴的精神資源,社會記憶的保存,對于增強民族與社會的根源性和認同感有著重要的意義。20 世紀90年代,聯合國教科文組織啟動了“世界記憶工程”項目,旨在遴選和保存最具代表意義的社會記憶遺產,作為一個民族、一個社會的文化徽章。在2001年11月中國人民大學主辦的“中國首屆檔案學博士論壇國際學術研討會”上,“社會記憶”再次成為研討的焦點,眾多學者在重申社會記憶價值的同時,再次強調了檔案部門在社會記憶保存中的責任與使命[1]。
檔案部門是建構社會記憶的主要機構,以存檔的方式保存大量信息資源,才能維持其原始性,進而如實還原和展示社會演化的歷程。在“社會記憶”思想的指導下,檔案部門以一種更為負責、更為認真地態度對待各種類型檔案的保存,將其作為傳承歷史,延續文脈的精髓。遺憾的是,身處信息化的大背景下,依托互聯網技術和信息技術生成的大量網絡資源卻并未得到檔案部門的關注,也未能以建檔的方式加以保存。本文將從檔案部門構建社會記憶的角度,初步研究檔案部門的網絡信息存檔。
在信息時代,網絡已成為全球最大的信息資源庫。凡是以數字化方式直接發布在互聯網上并通過計算機網絡傳播利用的各種信息資源皆可納入網絡信息的范疇。網絡信息的種類可以按照來源、內容、形式等不同標準進行劃分,鑒于本文是以檔案部門構建社會記憶為視角,而來源原則是檔案專業最基本的原則,所以筆者按照來源來劃分網絡信息的種類:政府網絡信息、企業網絡信息、科研教育機構網絡信息、社會團體網絡信息、個人網絡信息等。網絡信息能夠真實地反映政治生態變化、社會發展歷程、個人人生體驗等,是歷史的真憑實據,具有憑證價值;又能夠記錄事實和經驗,提供知識與信息,具有情報價值。
據中國互聯網絡信息中心(CNNIC)測算,截至2013年12月,中國網民規模達到6.18 億,全年新增網民5358 萬人,互聯網的普及率增至45.8%,較2012年底提升3.7 個百分點[2]。很明顯,互聯網在經濟社會中地位提升,反映文化、思想、事件的網絡信息大量產生,它們構成了社會記憶的重要部分。此外,網絡信息具有實時更新性和易失性。檔案部門為構建完整的社會記憶,對網絡信息存檔就是必要和緊迫的。
國外已經開展了相關探索,其中較典型的是美國國會圖書館網頁信息存檔(LCWA) 項目和Internet Archive 項目。LCWA,主要提供數字信息的收集、保存和利用服務,它保存了如總統選舉、伊拉克戰爭、911 事件等專題的網絡信息[3]。Internet Archive 從1996年成立之初起就開始從事原生數字信息(主要是網頁信息)的存檔實踐,致力于全面采集和保存全球網絡中公開可用的信息資源,使現在和以后的學者和研究人員能永久訪問[4]。
在借鑒國內外現有經驗的基礎上,根據傳統檔案建設管理的流程,筆者認為網絡信息存檔應該從收集(采集)、鑒定、整理、保管、檢索和利用這幾個流程展開。其中,采集、鑒定、保管是關鍵流程,本文將從這三大主要環節對網絡信息存檔的實施進行探索。
采集是網絡信息存檔的第一個環節,是開展后續工作的前提和基礎,主要涉及采集范圍、采集方式和采集時間三個方面。
從采集范圍看,“全面而又有所側重”應當是基本要求。目前,網絡信息的采集主要有全面采集、選擇采集和聯合采集三種方法。全面采集是對所有的網絡信息進行收集保存,如美國的Internet Archive 項目;選擇采集是基于主題或基于呈繳法律對部分網絡信息的收集,如澳大利亞的PANDORA 項目;聯合采集是前兩種采集方式的結合,如我國國家圖書館的“網絡信息資源采集與保存試驗項目(WICP)”[5]。筆者認為,網絡信息數量龐大,質量良莠不齊,若采用全面采集策略可能會面臨技術挑戰、經費短缺和權利限制等問題,而選擇采集可能會遺失大量社會記憶。故我國檔案部門采取聯合采集的方式可能更好,既要包羅萬象,盡可能覆蓋人類的各個知識領域,又要精挑細選,注意有所側重。
從采集方式看,目前主要有自動采集和人工采集。自動采集是利用采集工具或系統自動對網絡信息進行捕獲。澳大利亞國家圖書館開發的PANDAS 系統就具備這樣的功能[6]。人工采集則是由人對網絡信息進行篩選從而確定哪些信息需要采集。兩種方式各有優缺點,如自動采集更快捷方便,節省人力、物力,但是采集的信息也許并不能完全符合人們的利用需求,而人工采集雖然能夠從利用需求出發進行采集,卻過于繁瑣。我國檔案部門可以綜合運用這兩種方式,需要全部采集的網絡信息采取自動采集,對無法判別利用情況的信息采用人工采集。
從采集時間看,按照網絡信息的更新頻率實時采集。網絡信息是一種不斷變化與更新的動態資源,在保持高速增長的同時也在大批消亡,如果不及時采取采集措施,在其消失之后人們將再也無法獲取。由于各類網絡信息的更新頻率不同,若仿照紙質文件按固定時間定期歸檔的方式進行信息采集,肯定是不可取的,所以筆者建議檔案部門根據不同網絡信息的更新規律,找出合理的采集頻率,按更新頻率進行采集。
鑒定通常有真偽和價值鑒定兩種。此處的鑒定主要是指價值鑒定,即判斷網絡信息是否有保存價值。網絡信息區別于紙質文件的最大不同在于它的軟硬件依賴性,需要通過計算機才能為人工所識讀。因此,單純的內容上的有用性不足以構成網絡信息保存價值,還必須從技術上保證其可被識讀,這就要求鑒定從兩方面入手,一是判斷網絡信息內容的價值(內容鑒定),二是判斷網絡信息是否具有可讀性(技術鑒定)。
從內容鑒定方面看,通過不同的采集手段采集到的信息并不是全都要保存,只有那些反映了真實的社會面貌且有長遠利用價值的原生網絡信息才有保存的必要。根據網絡信息的特點,內容鑒定過程中應遵循兩個原則:原生性和價值性。原生性要求保存的網絡信息必須是第一手產生的,后經復制、粘貼、轉載的不納入保存范圍。價值性要求保存的網絡信息必須是真實可信、未經惡意篡改的,具有可茲為憑的憑證價值;或包含一定的知識與信息,具有情報價值;或具有能滿足形成機關需求的第一價值;或具有對社會、未來有用的第二價值。
從技術鑒定方面看,是對網絡信息真實性、完整性、可讀性的分析。真實性是檢測網絡信息是否是當時當人當事形成的,在形成之后是否經過篡改。完整性是檢測網絡信息的各個要素是否完備,與其相連接的數據是否收集齊全。可讀性是檢測網絡信息是否可在計算機上正常讀出,有沒有鏈接錯誤或亂碼等異常。只有真實、完整、可讀的網絡信息才能提供利用,具有保存價值。
保管是網絡信息存檔的三大關鍵環節之一,對于網絡信息的長期存取利用、網絡信息價值的發揮、延續數字時代人類的記憶有著重要的作用。網絡信息的保管就是要長期維護網絡信息的真實性、可靠性、可讀性,最大限度地防止和減少損毀以及因為軟硬件過時造成的喪失,保證人們在可預料的將來能夠獲取該網絡信息。
從保管方式看,目前對網絡信息的保管主要有兩種方式:一是將收集到的網絡信息保存在項目實施機構的內部網絡中,如英國網絡信息保存聯盟計劃UKWAC 建立本地收藏集中保管網絡信息[7];二是將收集到的網絡信息保存到硬盤或磁帶等載體介質上,如芬蘭國家圖書館[8]。筆者認為,檔案部門將網絡信息集中傳輸至獨立的、可脫機保存的載體介質上將更利于網絡信息的長久保存和利用。
從保管內容看,第一,保管存儲的網絡信息內容。對于保管在內部網絡中的網絡信息,應保管好本地收藏等文件夾;對于脫機保存在載體介質上的網絡信息,應保管好存儲載體。第二,保管網絡信息的各種支持軟硬件。網絡信息在網絡上傳播,必須依靠某種專門的計算機軟硬件環境才能保存、閱讀使用,這就使得我們在保管網絡信息的同時,還必須保存該網絡信息貯存的軟硬件利用環境,包括操作系統、應用軟件、硬件設備等,以保證網絡信息的長期可讀性,以便日后能使用該網絡信息。第三,保管網絡信息相關的背景信息。這些背景信息包括網絡信息的產生環境、產生時間、產生地點、產生原因和受眾等,為網絡信息提供廣泛的社會文化和歷史線索,能更完整地保存網絡信息。
從保管技術看,針對網絡信息讀取所依賴的計算機軟硬件系統更新換代后,網絡信息對新的軟硬件環境不兼容等問題,常用的技術有“遷移”和“仿真”,前者是將網絡信息轉存到新環境中,后者是模擬出舊環境。還有一種保存計算機過時的軟硬件設備的技術叫“技術典藏”,強調應保存網絡信息的原始運作環境[9]。
目前很多國家及國際性組織都進行了網絡信息存檔的實踐,他們在建設網絡信息存檔項目的過程中取得了一定成果,也面臨了一些問題,這給了我國借鑒與啟發。本文將從我國的實際情況出發,分析我國檔案部門在存檔網絡信息的過程中可能面臨的問題并對突破方法進行初步探索。
目前我國尚無相關規定由哪個機構來收集保管網絡信息,是檔案館還是圖書館亦或是形成機關對網絡信息進行存檔尚不明確,學術界對這個問題的看法也并不一致。責任歸屬不明致使少有人員或機構收集、保管網絡信息,造成海量有價值網絡信息的嚴重流失。
不可否認的是,檔案館一直擔負著保存以紙張、磁帶、光盤等為存儲載體的信息資源的任務,隨著現代信息技術的發展及應用,一些大中型檔案館已經基本具備了保存網絡信息所需理論研究、標準制定及技術開發等方面的能力,且考慮到由檔案部門收藏的網絡信息更能反映社會原貌,更能保護好完整的社會記憶,因此檔案部門應該承擔起網絡信息存檔的重任。我國各級檔案部門可以首先明確各級各類檔案業務部門在網絡信息存檔中的責任,其次借鑒紙質文件收集、歸檔、保管等一整套業務規范來指導網絡信息存檔的運作,最終以此為基礎建立一整套的責任體系。
盡管網絡信息被認為是公共資源,但仍有越來越多與知識產權相關的法律明確提出了對網絡信息保護的規定,一些網站采用了一定的技術保護手段防止復制和保存其網頁信息。這種觀念上的公共獲取與現實中的版權保護之間的沖突形成了網絡信息存檔領域的知識產權法律問題,即網絡信息存檔中有關主體是否有權將其捕獲到的網絡信息加以保存、轉換格式、復制拷貝和提供檢索等。
目前國際社會為解決此問題的一些探索實踐是:一、制定呈繳法。挪威、丹麥已經制定了網絡信息呈繳法,并對呈繳的責任者、內容、方式、格式作出相應規定[10]。二、修改知識產權法與其它相關法律。如法國2006年通過的知識產權法規定,生產者或出版者不能用代碼或訪問控制來阻止授權機構采集其站點的信息[11]。筆者認為我國檔案部門可以借鑒國外的經驗,做出自己的探索:其一,我國雖沒有一部關于網絡信息的呈繳法律,但是對于傳統印刷型出版物和實體電子出版物的呈繳都有相關的規定。我國可以在紙質與電子出版物呈繳的基礎上,將呈繳范圍拓展到網絡信息領域,對網絡信息具體的呈繳范圍、呈繳時間、呈繳方式等作出明確規定。其二,我國也可以收縮知識產權對網絡信息存檔的限制,增加對網絡信息的合理使用范圍,通過修改知識產權法來實現國家公共文化事業單位對網絡信息的合理采集與保存。其三,我國還可以與出版者協商,征求出版者許可發布的范圍,或發送版權聲明詢問可否下載、下載深度,可否公開、何時公開等。
網絡信息存檔的目標是永久保存海量的網絡信息,數字化存儲的信息量大、時間長,所需資金必然多。且項目實驗、技術開發都需要進行大量的初始投資。此外,網絡信息的價值一般都要經過一段相當長的時間才會顯現出來,投資回報周期相當漫長。所以,實施網絡信息存檔的主體,其經費從何而來是一個嚴重的問題。
國外比較成功的網絡信息存檔項目,如美國的LCWA 和IA 項目都是依托國會圖書館的財政支持和商業機構(如Alexa)的捐資贊助來實施的。美國國會圖書館在2003年通過了國家數字信息基礎設施和保存計劃,獲得了1 億美元的經費支持;2007年美國國家基金會和梅隆基金會資助“藍帶特別小組”,關注數字保存和持續存取在經濟上的可持續性發展等[12]。我國檔案部門若僅僅依靠館內自籌是很難滿足網絡信息存檔的資金需求的,在開展網絡信息存檔的探索時必須考慮爭取國家財政支持和企業捐資贊助。
網絡信息隨時可能因為被忽略、遺忘,甚至只是簡單的短視行為而快速消失,而這種因歷史記憶的丟失而造成的損失將是無法挽回的,作為“構建社會記憶主體”的檔案部門秉承著“守護過去,記錄現在,銘記未來”的歷史使命,在保存網絡信息、構建完整的社會記憶大廈的過程中責無旁貸,理應在網絡信息存檔方面有所作為。
*本文系國家社科青年基金項目“我國非物質文化遺產建檔標準體系研究”(項目批準號:12CTQ038)、教育部人文社科青年基金項目“基于群體智慧的非物質文化遺產檔案管理模式及其實現機制研究”(項目批準號:12YJC870005)的階段性成果之一。
[1]錢程程.從檔案記憶觀視角看檔案與檔案工作[J].云南檔案,2010,05:3-4.
[2]中國互聯網絡信息中心.第33次中國互聯網絡發展狀況統計報告[EB/OL].[2014- 3- 5]. http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201403/t20140305_46240.htm.
[3]安琳.國外網頁信息存檔項目及相關問題研究[J].圖書館建設,2009,12:107-110+113.
[4][5]劉青,孔凡蓮.中國網絡信息存檔及其與國外的比較——基于國家圖書館WICP項目的研究[J].圖書情報工作,2013,18:80-86+93.
[6]徐健.英國網絡信息保存聯盟計劃(UKWAC)及其啟示.圖書館論壇,2007(2):81-84.
[7]謝春林.英、美、澳、挪網絡信息保存政策的經驗與借鑒[J].情報資料工作,2009,06:40-44.
[8]陳力,郝守真,王志庚.網絡信息資源的采集與保存——國家圖書館的WICP和ODBN項目介紹[J].國家圖書館學刊,2004,01:2-6.
[9]陳慰湧,秦建偉.數字信息長期保存研究現狀分析[J].浙江檔案,2008,01:43-45.
[10]向菁,吳振新.網絡信息資源保存發展現狀及趨勢分析[J].中國圖書館學報,2009,02:34-41.
[11]仇壯麗,許冬玲,卜淑芬.歸檔網絡信息價值判斷模型之研究現狀與展望[J].檔案學通訊,2010,06:61-64.
[12]周毅.論網絡信息存檔權及其生成[J].中國圖書館學報,2011,01:102-108.