摘 要:電子檔案文件保存技術(shù)在“互聯(lián)網(wǎng)+”時(shí)代面臨一系列問(wèn)題與挑戰(zhàn),為解決這個(gè)難題,本文試圖在電子檔案長(zhǎng)期保存的技術(shù)中提出從技術(shù)路線、文件格式、存儲(chǔ)載體、元數(shù)據(jù)管理和軟件功能等方面的需求。
關(guān)鍵詞:電子檔案文件 長(zhǎng)期保存 技術(shù)
中圖分類(lèi)號(hào):G27文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-9082(2020)03-00-01
隨著互聯(lián)網(wǎng)時(shí)代的到來(lái),新科技新技術(shù)的飛速發(fā)展,政府無(wú)紙化辦公逐步推進(jìn),紙質(zhì)版檔案文件慢慢將被電子檔案文件替代,以幾何級(jí)的速度迅速增加。
電子文件(檔案)是指國(guó)家機(jī)構(gòu)、社會(huì)組織或者個(gè)人在履行其法定職責(zé)或處理事務(wù)過(guò)程中,通過(guò)計(jì)算機(jī)等電子設(shè)備形成、辦理、傳輸和存儲(chǔ)的數(shù)字格式的各種信息記錄。
如何長(zhǎng)期保存電子檔案,這一課題迅速擺在每一個(gè)檔案文件管理者的面前。電子文件(檔案)長(zhǎng)期保存,是指用一種可靠的,科學(xué)合理的方式,長(zhǎng)期維護(hù)電子文件(檔案)真實(shí)完整有效的行為。重要的信息資源是電子文件(檔案)。它們是從事政治、軍事、經(jīng)濟(jì)、科技、文化、等活動(dòng)的國(guó)家機(jī)關(guān)、社會(huì)團(tuán)體和個(gè)人形成的對(duì)國(guó)家和社會(huì)具有重要價(jià)值的各種文字、圖表、音像等形式的直接歷史記載。它們也是社會(huì)數(shù)字資產(chǎn)不可或缺的一部分。實(shí)現(xiàn)電子文件(檔案)的長(zhǎng)期保存,既是文件與檔案部門(mén)的重要問(wèn)題,也是全人類(lèi)的共同使命。
電子文件(檔案)長(zhǎng)期保存的解決問(wèn)題,一定要確定長(zhǎng)期保存電子文件(檔案)的要求,制度、管理、技術(shù)、安全等方面包括其中。必須明確電子文件長(zhǎng)期保存的要求,包含制度、管理、技術(shù)、安全等方面。本文是重點(diǎn)是從技術(shù)層面進(jìn)行探討,包括技術(shù)路線、文件格式、存儲(chǔ)載體、軟件功能和元數(shù)據(jù)管理等。
2012年,全國(guó)電子文件管理工作聯(lián)席會(huì)議發(fā)布了《電子文件真實(shí)性保障和長(zhǎng)期保存等關(guān)鍵技術(shù)研究》課題。本文對(duì)電子文件長(zhǎng)期保存的關(guān)鍵技術(shù)進(jìn)行了研究,并提出了初步的解決方案。電子文件(檔案)長(zhǎng)期保存的研究成果,在國(guó)內(nèi)外相關(guān)部門(mén)都沒(méi)有提出完整、權(quán)威的技術(shù)要求。目前這方面的難題遠(yuǎn)遠(yuǎn)超出取得的成績(jī),這與電子文檔管理面臨的五大技術(shù)挑戰(zhàn)相關(guān)。
一是數(shù)據(jù)規(guī)模大,在這個(gè)信息資源持續(xù)快速增長(zhǎng)的大數(shù)據(jù)時(shí)代,管理部門(mén)面臨電子文件(檔案)日益增多的形勢(shì),管理部門(mén)面臨著電子文件(檔案)不斷膨脹、承載范圍超出管理部門(mén)能力的局面。
二是格式多樣化,它主要體現(xiàn)在多樣性的電子文件的數(shù)字格式,這意味著管理部門(mén)需要處理電子文件各種不斷變化的格式。
三是類(lèi)型復(fù)雜性,電子文件不僅格式多樣,而且數(shù)據(jù)類(lèi)型也越來(lái)越繁雜。除了傳統(tǒng)類(lèi)型的文本、圖形、圖像、音頻和視頻文件外,各種新的媒體文件和數(shù)據(jù)文件也是層出疊現(xiàn),讓人目不暇接。
四是生命周期短,在信息技術(shù)飛速成長(zhǎng)的前提下,具有生命周期相對(duì)較短的特點(diǎn)是硬件、軟件、文件格式、存儲(chǔ)載體等。倘若不是按照文件生命周期的特點(diǎn)來(lái)定制解決方案,問(wèn)題就無(wú)法解決,將會(huì)使問(wèn)題更加復(fù)雜。
五是技術(shù)變化快,信息技術(shù)一直處于不斷成長(zhǎng)蛻變的過(guò)程中,如何使用相對(duì)穩(wěn)定前瞻的技術(shù)發(fā)現(xiàn)、傳遞和處理過(guò)去的電子文件,保證改進(jìn)后的新技術(shù)含量的方法與以往保存技術(shù)的相容性和連續(xù)性是管理部門(mén)面臨的挑戰(zhàn)。
面對(duì)以上這些問(wèn)題和挑戰(zhàn),我們文件和檔案部門(mén)和從事這項(xiàng)工作的工作人員應(yīng)該如何解決呢?在對(duì)國(guó)內(nèi)外相關(guān)研究項(xiàng)目進(jìn)行分析、總結(jié)的基礎(chǔ)上,充分考慮電子文件(檔案)的特點(diǎn),從技術(shù)路線、文件格式、存儲(chǔ)載體、存儲(chǔ)方式等方面提出了電子文件(檔案)長(zhǎng)期保存的技術(shù)要求,元數(shù)據(jù)管理和軟件功能。各部分技術(shù)要求的主要內(nèi)容如下:
1.技術(shù)路線:技術(shù)路線需求主要包括更新、遷移、仿真、封裝、再生五個(gè)方面內(nèi)容。
信息更新是指原始的技術(shù)環(huán)境下,適時(shí)重寫(xiě)信息數(shù)據(jù),將數(shù)據(jù)流從舊存儲(chǔ)介質(zhì)轉(zhuǎn)移到新存儲(chǔ)介質(zhì)上,防止由于存儲(chǔ)介質(zhì)物理性能變化而引起信息丟失的方法。例如:將過(guò)去的磁盤(pán)、光盤(pán)上的信息轉(zhuǎn)存到硬盤(pán)中存儲(chǔ),因?yàn)檫^(guò)去的磁盤(pán)、光盤(pán)容易損壞,信息易丟失。遷移是持續(xù)的將電子信息從一種技術(shù)環(huán)境轉(zhuǎn)移到另一種技術(shù)環(huán)境,這意味著基于字符的信息可以從一種存儲(chǔ)介質(zhì)傳輸?shù)搅硪环N存儲(chǔ)介質(zhì),以便長(zhǎng)期保存電子信息。仿真是用一個(gè)計(jì)算機(jī)系統(tǒng)克隆另一個(gè)計(jì)算機(jī)系統(tǒng),使兩者的操作系統(tǒng)功能完全的相同,也就是說(shuō),前者接收的數(shù)據(jù)與后者相同,并且后者相同的程序可以執(zhí)行。封裝技術(shù)是指通過(guò)規(guī)范電子檔案文件的封裝過(guò)程,為電子檔案文件提供統(tǒng)一的封裝格式,保證電子檔案文件及其元數(shù)據(jù)的完整合一性。封裝技術(shù)是指電子檔案的封裝過(guò)程,為電子檔案提供統(tǒng)一的封裝格式,確保電子檔案(文件)及其元數(shù)據(jù)的完整性。再生性保護(hù)技術(shù)是一種保護(hù)措施,如建筑物數(shù)據(jù)、圖紙等,能將過(guò)去一些有價(jià)值的電子信息及時(shí)轉(zhuǎn)換成微型或紙質(zhì)媒體。
2.文件格式:文件格式需求主要包括格式開(kāi)放、文件自包含、格式字描述、可轉(zhuǎn)換、支持技術(shù)認(rèn)證機(jī)制等方面內(nèi)容,結(jié)合各種格式電子檔案的特點(diǎn),對(duì)其進(jìn)行了擴(kuò)展。
格式開(kāi)放主要包括公開(kāi)發(fā)布的相應(yīng)標(biāo)準(zhǔn)和技術(shù)規(guī)范,確保簡(jiǎn)潔明了的格式標(biāo)準(zhǔn)和技術(shù)規(guī)范,不受專(zhuān)利、許可等限制。文件自包含主要是指文件中呈現(xiàn)的所有信息必須完全包括所有字體的字形描述信息或嵌入式字體程序信息、光柵圖像、矢量圖形、顏色信息、音視頻編碼信息等。格式自描述主要指設(shè)置標(biāo)準(zhǔn)元數(shù)據(jù)集可以與國(guó)際國(guó)內(nèi)相關(guān)標(biāo)準(zhǔn)建立映射),以文本方式(通常是XML)嵌入到文件中,并且易于提取和檢索等。支持電子檔案其他格式和長(zhǎng)期保存格式的相互轉(zhuǎn)換,還支持電子檔案過(guò)時(shí)的長(zhǎng)期保存格式向新的長(zhǎng)期保存格式的轉(zhuǎn)換。支持?jǐn)?shù)字簽名的技術(shù)認(rèn)證機(jī)制,各種操作系統(tǒng)和硬件平臺(tái)支持使用數(shù)字簽名,并且數(shù)字簽名的所有信息都是完全獨(dú)立的。
3.存儲(chǔ)載體:一般來(lái)說(shuō),電子檔案的存儲(chǔ)周期比存儲(chǔ)載體的壽命長(zhǎng),這使得電子檔案的長(zhǎng)期保存受到存儲(chǔ)載體技術(shù)發(fā)展的制約,就電子文件(檔案)的存儲(chǔ)載體類(lèi)型而言,磁性載體目前比較成熟和普遍,光學(xué)載體和電(半導(dǎo)體)載體三類(lèi),每種載體都有自己的應(yīng)用領(lǐng)域。一般有以下幾種存儲(chǔ)方式:
在線存儲(chǔ),電子檔案一般直接存儲(chǔ)在信息系統(tǒng)中,通過(guò)應(yīng)用軟件可以實(shí)時(shí)存取,在目前的技術(shù)條件下,硬盤(pán)和基于硬盤(pán)的各種存儲(chǔ)系統(tǒng)(磁盤(pán)陣列、NAS存儲(chǔ)、SAN存儲(chǔ)、集群存儲(chǔ)等)仍然是主流的存儲(chǔ)方式;對(duì)于具有高安全性要求的數(shù)據(jù),可以考慮使用特殊的WORM磁盤(pán)(一次寫(xiě)入和幾次讀取硬盤(pán))。
在線備份與在線存儲(chǔ)結(jié)合使用,定期將數(shù)據(jù)備份到本地備份設(shè)備,彌補(bǔ)了在線存儲(chǔ)中數(shù)據(jù)丟失等安全風(fēng)險(xiǎn)。目前,磁帶機(jī)(庫(kù))設(shè)備(以磁帶為載體)或虛擬磁帶庫(kù)設(shè)備(以硬盤(pán)為載體)是主流。
本地備份、異地保存:一種是將在線備份數(shù)據(jù)直接發(fā)送到磁帶或光盤(pán)到另一個(gè)地方存儲(chǔ);另一種是在本地再做一次備份,送到另一個(gè)地方保管,他們大多使用光盤(pán)作為備份介質(zhì),為了避免數(shù)據(jù)損壞或修改,要求采用一次性寫(xiě)入只讀光盤(pán)。近線存儲(chǔ)可用于實(shí)時(shí)性要求較低的數(shù)據(jù)。
在以往的解決方案中,以光盤(pán)為存儲(chǔ)載體的光盤(pán)庫(kù)等設(shè)備主要用于近線存儲(chǔ),隨著硬盤(pán)成本的降低和安全性的提高,近線存儲(chǔ)也逐漸采用各種基于硬盤(pán)的存儲(chǔ)系統(tǒng)。
異地(容災(zāi))存儲(chǔ),通常,數(shù)據(jù)通過(guò)網(wǎng)絡(luò)直接傳輸?shù)竭h(yuǎn)程存儲(chǔ)設(shè)備,例如,當(dāng)今廣泛使用的網(wǎng)絡(luò)云硬盤(pán)也是以硬盤(pán)為基礎(chǔ),以硬盤(pán)為主要載體的各種存儲(chǔ)系統(tǒng)。主要防止地震、水災(zāi)、火災(zāi)等不可抗力對(duì)信息資源的破壞。
異質(zhì)備份,對(duì)于特別重要的電子文件,為了電子文件的長(zhǎng)期存儲(chǔ)和安全存儲(chǔ),如將電子文件從數(shù)字信號(hào)轉(zhuǎn)換為模擬信號(hào)并存儲(chǔ)在縮微膠卷上的多格式備份。
4.元數(shù)據(jù)管理:元數(shù)據(jù)保證并證明了電子檔案的真實(shí)性和憑證價(jià)值,它對(duì)電子檔案的保護(hù)和長(zhǎng)期保存、電子檔案的有效管理、電子檔案的方便查詢和利用具有重要作用。
5.軟件功能:軟件功能需求包括存儲(chǔ)策略管理、存儲(chǔ)環(huán)境管理、備份載體管理、文件倉(cāng)庫(kù)、文件檢測(cè)、格式轉(zhuǎn)換、文件遷移、文件提取和系統(tǒng)管理。軟件功能需求是電子檔案長(zhǎng)期保存需求的固化,把理論研究成果轉(zhuǎn)化為實(shí)際應(yīng)用是關(guān)鍵。
以上歸納總結(jié)的電子檔案文件長(zhǎng)期保存需求,特別是軟件功能需求還需在電子檔案文件接受和長(zhǎng)期保存系統(tǒng)建設(shè)工程項(xiàng)目中得到實(shí)踐驗(yàn)證。但是隨著信息技術(shù)不斷高速的發(fā)展,各種新技術(shù)新媒體文件、數(shù)據(jù)文件層出不窮,電子檔案文件的管理人員和研發(fā)人員還需要結(jié)合實(shí)際應(yīng)用過(guò)程中反饋的問(wèn)題進(jìn)行進(jìn)一步的梳理總結(jié),提煉電子檔案文件長(zhǎng)期保存的新技術(shù),使其更為完備。
參考文獻(xiàn)
[1]王賀芹.電子文件及電子檔案管理初探[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2002:66-68+77.
[2]邱曉威.電子文件與電子檔案的管理問(wèn)題與對(duì)策[J].中國(guó)檔案,1999,(03):32-34.
[3]劉偉晏.電子文件歸檔后的保存、維護(hù)與利用[J].中國(guó)檔案,1999,(05):31-33.
[4]馮惠玲.電子文件與紙質(zhì)文件管理的共存與互動(dòng)[J].中國(guó)檔案,2003,(12):40-42.
[5]魏招秀.談電子檔案的長(zhǎng)期保存[J].蘭臺(tái)世界,2010(24):14-15.
作者簡(jiǎn)介:孫進(jìn),男,(1971-)安徽巢湖人,安徽省檔案學(xué)會(huì)會(huì)員,主要從事信息技術(shù)和檔案管理研究。