
摘要:檔案數字化、數字化檔案和數字檔案三個概念,混淆使用的情況比較嚴重。文章對這三個概念進行了全面的辨析。認為:檔案數字化概念有廣義和狹義之分;檔案數字化是形成數字化檔案的過程,數字化檔案是檔案數字化的結果;數字化檔案不是檔案,而只是檔案數字形式復制品;數字檔案才是真正的檔案。
關鍵詞:檔案數字化;數字化檔案;數字檔案;概念;辨析
1 涉及檔案數字化、數字化檔案和數字檔案概念文獻數量情況
檔案數字化、數字化檔案和數字檔案,是近些年來檔案界使用頻率很高的三個概念。在許多文章中更是同時出現。筆者對中國知網的文獻進行了檢索(以下文獻數據也均來自知網),表1是1997年至2012年涉及這三個概念的文獻數量檢索統計。由表1可見,近15年來,期刊文獻中涉及這三個概念(不論是單獨使用,還是組合使用)的文獻數量均呈不斷上升趨勢。值得關注的是這三個概念在同一文獻中同時或兩兩同時出現的頻率也在上升,這其中難免會出現將三者混淆使用或概念混淆的情況。因此,有必要對其進行辨析。
2 檔案數字化的概念
國內最早提及“檔案數字化”的文獻是1993年賈惠波在《檔案學研究》上發表的《光盤在檔案存貯管理應用中的可靠性和壽命問題》一文。截至2012年10月共有11115篇文獻涉及“檔案數字化”概念。
國內最早對“檔案數字化”下定義的是李筱春。2002年,他將“檔案數字化”定義為:“檔案數字化是指計算機數字化技術在檔案信息領域的應用。檔案數字化包括兩個方面的內容:一個是把傳統的檔案信息,如文字、數值、(單色的和彩色的)圖形、(靜止的和活動的)圖像、聲音等的檔案信息數字化,另一個是把數字化的檔案信息還原成文字、數值、圖形、圖像、聲音等傳統的檔案信息。前者是為了將傳統的檔案信息輸入計算機,后者是將數字化的檔案信息由計算機輸出給用戶。”[1]
之后有122篇文獻對“檔案數字化”下過定義。其中有代表性的如屠躍明、翟瑤認為:“檔案數字化是指利用計算機等技術手段將經過鑒選、原本存儲于傳統載體上的檔案信息進行數字化轉換并加以存儲、保護、檢索利用的系統工程。”[2]
對檔案數字化的定義有兩點共性:一是與計算機技術有關;二是將其他載體的檔案轉化為數字化信息。不同之處:一是數字化過程是否可逆;二是單一轉換與綜合利用的區別。
3 數字化檔案的概念
國內最早提及“數字化檔案”的文獻是1986年洛克里奇、張春艷在《國際地震動態》上發表的《美國全國地球物理資料中心的自然災害活動》一文。截至2012年10月共有5228篇文獻涉及“數字化檔案”概念。與檔案數字化不同的是,在這5228篇文獻中,只有4篇對“數字化檔案”下過定義。
國內最早對“數字化檔案”下定義的是鄒悅,2005年,他在《數字檔案資源建設中的著作權問題研究》一文中認為:“數字化檔案指的是傳統檔案數字化后形成的數字化形式的檔案。”[3]鄭重認為:“數字化檔案是指由辦公自動化形成的電子文件歸檔后形成的電子檔案。”并指出:“它從形成開始,就是數字形式。”[4]李殿環認為:“數字化檔案來源包括兩個部分,一部分是隨著政府信息化的進程,網絡化辦公與無紙化辦公的出現,各機構生成大量的電子文件,電子文件歸檔后作為電子檔案存儲在檔案館。另一部分就是館藏的紙質檔案、照片、膠片等傳統檔案利用數據庫技術、數據壓縮技術、高速掃描技術等技術手段轉化為數字化的信息。”[5]
對于數字化檔案的定義差別比較大,有認為是“電子文件歸檔”后的產物;有認為是“傳統檔案數字化后形成的數字化形式的檔案”;還有認為前兩者都是的。
4 數字檔案的概念
國內最早提及“數字檔案”的文獻是1979年李志豪在《經濟管理》上發表的《談談商業一級站會計統計結合的實踐》一文。截至2012年10月共有7DDwEd/nmZTUIdX53mPNE7rK29Lbdtx3YqdIKmS3H19M=558篇文獻涉及“數字檔案”概念。而對“數字檔案”下過定義的只有13篇。
國內最早對“數字檔案”下定義的是宋巖。2005年,他首次將“數字檔案”定義為:“數字檔案是指用計算機等工具對歷史記錄進行數字編碼,并將所得數據記錄保留在盤、片等載體上的一種檔案。從記錄方式來說,數字檔案是用計算機語言,將歷史記錄數據化的形式來記錄的。……從載體來說,它摒棄了人們常用的紙張等常用的載體,而用磁盤、光盤等載體。”[6]
何貞健將“數字檔案”定義為:在“工作中形成的歸檔電子文件以及與其相關的元數據、背景信息”。[7]趙麗榮認為:“數字檔案是指館藏檔案的數字化信息與移交進館的電子文件信息的總稱。”[8]
對于數字檔案的定義同樣差別比較大,有認為是“歸檔電子文件”的;有認為是“館藏檔案的數字化信息”的;還有認為前兩者都是的。這同對數字化檔案的定義一樣,也就是說數字化檔案與數字檔案成了同一概念。
5 對檔案數字化、數字化檔案和數字檔案概念的思考
5.1 檔案數字化與數字化檔案。檔案數字化概念有廣義和狹義之分。狹義的檔案數字化,是指將不同載體形態和記錄方式的檔案信息通過計算機錄入、轉化、處理等形式,把文字、圖像、聲音等信息轉化為0和1組成的數碼序列,然后存貯到磁盤、光盤等物理載體上的過程。簡單地說,檔案數字化是將非數字形式檔案轉化為數字信息的過程。這里有三個要點:一是檔案數字化的對象是檔案;二是檔案數字化的對象是非數字形式檔案;三是檔案數字化是一個從非數字形式檔案向數字信息轉換的過程。廣義的檔案數字化包括兩個方面:一是檔案目錄的數字化,就是將手工檢索的紙質檔案目錄錄入計算機,建立檔案目錄數據庫;二是將不同載體形態和記錄方式的檔案全部數字化,主要是紙質檔案的全文內容數字化。檔案全文數字化采用掃描錄入方式,將檔案全文內容按原貌逐頁存儲為圖像文件,并為其編制目錄索引,或是將文字形式的檔案經光學字符技術識別后采用文本格式存儲檔案內容,輔之以全文檢索數據庫兩種不同方式。
所謂數字化檔案,就是將不同載體形態和記錄方式的檔案,利用計算機、掃描、圖形圖像處理、數據庫等技術,把文字、圖像、聲音等信息轉化為0和1組成的數碼序列的檔案復制品。也就是非數字形式檔案數字化后形成的數字形式的檔案,是非數字形式檔案數字化后的結果。簡單地說,數字化檔案就是非數字形式檔案的數字形式復制品。數字化檔案僅指狹義檔案數字化后的結果,廣義檔案數字化的檔案目錄數字化結果不包括在內,檔案目錄數字化的結果不是數字化檔案,而是管理、利用檔案的輔助品。
檔案數字化是以保護數字化檔案母體存在和利用為目的一種檔案保護和利用手段。檔案數字化過程是通過數字化的技術手段,應用相應的數字化設備,采取規范的數字化標準產生數字化檔案的過程。
檔案數字化與數字化檔案有著密切的聯系,檔案數字化是形成數字化檔案的過程,數字化檔案是檔案數字化的結果,沒有檔案數字化就沒有數字化檔案。
檔案數字化的目的與產生數字化檔案的目的一樣,是為了使檔案利用工作適應現代信息社會,滿足社會各方面對檔案信息資源日益擴大的需求,提供遠程和便捷的檔案利用服務,提高檔案信息檢索速度,減少檔案原件(特別是珍貴檔案)頻繁使用而造成的磨損,保護檔案原件,從而充分發揮館藏檔案信息資源的優勢,促進館藏檔案的開發與利用。
5.2 數字檔案與數字化檔案。所謂數字檔案,是指機關、團體、企事業單位和其他組織以及個人在社會活動中,通過計算機等電子設備直接形成以數字代碼記錄的文字、圖表、圖像、音頻、視頻等不同形式的歷史記錄。
數字檔案是現代信息技術條件下產生的新型的檔案,它是辦公自動化和計算機技術、信息技術快速發展的必然結果,它是檔案的一種新的形式,并將成為檔案的主要形式。數字檔案包含著一切檔案的要素,它產生于機關、團體、企事業單位和其他組織以及個人的社會活動中,并且是直接形成的數字歷史記錄。盡管數字檔案存在著信息的非人工識讀性,而只有經過計算機特定的程序解碼,通過輸出設備使它還原再現,才能人工識讀;存在著對計算機系統的依賴性,數字檔案從產生到歸檔管理再到利用都要借助于計算機系統才能實現;存在著信息的易變性,數字檔案在其生成、處理和管理等過程中,其信息內容極易被修改,等等局限,但這些并不影響數字檔案成為檔案家族中的一員。雖然數字檔案存在著原始記錄性和法律效力的認可問題,而隨著信息技術的發展和管理措施的到位,采取各種形式的技術手段來保證數字檔案的原始記錄性和法律效力,相信這些問題會得到滿意的解決。但這既不影響它的檔案特征,也改變不了它的檔案本質屬性。數字檔案是實實在在地地道道的檔案。
而數字化檔案,正如上文所述,數字化檔案只是檔案數字化過程中的產物,數字化檔案是非數字形式檔案的數字形式復制品。數字化檔案不是機關、團體、企事業單位和其他組織以及個人在社會活動中直接形成的歷史記錄,它不具備檔案的特征和本質屬性。檔案的數字形式復制品也并不能等于被復制的檔案本身,因此,數字化檔案不是檔案。
對于數字化檔案不是檔案的認識,我們也可以從對檔案縮微復制品的認識中找到相似的答案。攝影技術的發明,為人類社會增添了新的記錄形式,也為檔案的存儲增加了新的形式。在攝影技術基礎上發展起來的縮微技術就是這種新的存儲形式在檔案存儲方面的具體運用。攝影技術為檔案增添了新的成員——照片檔案,也為減少檔案原件(特別是珍貴檔案)頻繁使用而造成的磨損增添了新復制存儲形式——檔案縮微復制品。運用攝影技術在人類社會活動中直接形成的記錄,就形成了照片檔案。照片檔案包含檔案的一切要素,具備了檔案的特征和本質屬性,是實實在在地地道道的檔案。而運用縮微技術對檔案原件進行處理就產生了檔案縮微復制品,檔案縮微復制品是檔案的復制件,而不是檔案,它并不具備檔案的特征和本質屬性。對于檔案縮微復制品,雖有不少人稱其為“縮微檔案”,但是,“縮微檔案”并不是檔案,而且“縮微檔案”的說法,只是一種簡化不規范的說法,不能望文生義地就認為“縮微檔案”是檔案。雖然“縮微檔案”是不是檔案,也曾有過爭議,但基本上否定了“縮微檔案”是檔案的看法。在吳寶康主編的《檔案學詞典》中,就沒有“縮微檔案”一詞,而只有“檔案縮微復制品”一詞。對“檔案縮微復制品”的解釋是:“將檔案按一定比例縮拍在感光材料上制成的縮微品。”“一般可以作為檔案原件的代用品,有利于保護檔案原件。”[9]《中國大百科全書·圖書館學 情報學 檔案學》中收錄的是“縮微品檔案”一詞,解釋為:“利用縮微攝影方法制成的檔案原件縮微品”,“縮微品檔案是檔案原件的副本”。[10]兩者強調的都是檔案的復制品。數字化檔案也同縮微檔案一樣,不是檔案,只是在新的技術條件下,又增添了一種新的檔案復制手段,增加了一種新的檔案存儲形式,添加一種新的檔案復制品。數字化檔案確切的稱謂應該是“檔案數字復制品”或者“檔案數字形式復制品”。
那種將數字化檔案定義為:既包括電子文件歸檔后作為電子檔案存儲在檔案館的,也包括館藏的紙質檔案、照片、膠片等傳統檔案利用數據庫技術、數據壓縮技術、高速掃描技術等技術手段轉化為數字化的信息的;以及那種將數字檔案定義為:數字檔案是指館藏檔案的數字化信息與移交進館的電子文件信息的總稱等的認識,都是將檔案與檔案復制品混為一談,這不僅不利于認識什么是數字檔案,也不利于檔案學術研究。為避免概念混亂,建議放棄“數字化檔案”的說法,改稱為“檔案數字復制品”或者“檔案數字形式復制品”。并給“數字檔案”正名,將所謂的“數字化檔案”——“檔案數字復制品”排除在“數字檔案”之外。
5.3 檔案數字化、數字化檔案與數字檔案。檔案數字化與數字化檔案這兩個概念,雖然看起來都有“數字”和“檔案”,但是它們與“數字檔案”一點關系都沒有。數字化檔案就是檔案數字化過程中的結果產物,檔案數字化過程是由檔案管理部門主動對所藏檔案進行的數字化加工,而在這個由檔案管理部門主動做的檔案數字化過程中并不產生新的檔案(數字檔案),數字化檔案的產生完全由檔案管理部門掌控,數字化檔案僅表示是檔案數字形式的復制品。而且,檔案數字化不是簡單把檔案掃描成圖片,數字化檔案也并非是電子圖片,檔案數字化和檔案信息化等問題還需要進一步探討。
數字檔案的產生則完全是另外一個過程,它是由機關、團體、企事業單位和其他組織以及個人在社會活動中直接形成的,是真正檔案的形成過程,而不是由檔案管理部門加工形成的。厘清它們的關系對于認識什么是數字檔案有著積極的意義。
注:本文為2012年度河南省檔案局科技項目《基于網站集群的公共檔案信息資源共享平臺管理研究》的階段性成果,項目批準號為:2012-X-68。
參考文獻:
[1]李筱春.手段 途徑 結果——檔案數字化、網絡化、信息化三者關系淺析[J].蘭臺世界,2002(3).
[2]屠躍明,翟瑤.檔案數字化的元數據研究[J].蘭臺世界,2012(14)
[3]鄒悅.數字檔案資源建設中的著作權問題研究[D].武漢大學碩士學位論文,2005.
[4]鄭重.淺談新時期檔案信息化建設的主要內容及其關系[A].江蘇省檔案學會:檔案工作應對入世挑戰學術研討會文集[C].江蘇省檔案學會,2002:7.
[5]李殿環《基于.NET的數字化檔案館的研究和開發》[D].西安建筑科技大學碩士學位論文,2009:6.
[6]宋巖.檔案數字化是檔案管理發展的必然趨勢[J].肇慶學院學報,2005(6).
[7]何貞健.國土資源數字檔案標準建設有關問題的探討[A].福建省土地學會:2007年福建省土地學會年會征文集[C].福建省土地學會,2007:6.
[8]趙麗榮.關于數字檔案館構建的深度剖析[J].西部資源,2011(5).
[9]檔案學詞典[M].上海:上海辭書出版社,1994,360-361.
[10]中國大百科全書·圖書館學 情報學 檔案學[M].北京:中國大百科全書出版社,1993,407.
(劉東斌組稿 作者單位:開封市檔案局 來稿日期:2012-10-18)</