李亞紅,趙梅亭
(1河南中醫學院圖書館,河南 鄭州 450008;2河南農業大學圖書館,河南 鄭州450002)
無論是人、生態系統,還是技術和企業,在各自的生命周期內,都要經歷從出生到成熟再到衰敗的不同過程。信息同樣有著產生、發展和消亡的過程。信息從它產生之日起就自然而然地進入了一個循環,經過收集、復制、訪問、遷移、刪除等多個步驟,最終完成了一個生命周期,周而復始。
ISO/TC171文件成像應用技術委員會2000年10月12日倫敦年會通過的405號決議稱“信息無論是以物理的形式還是以電子的形式管理,該信息生命周期包括信息的生成、獲取、標引、存儲、檢索、分發、呈現、遷移、交換、保護與最后處置或廢棄”。
Legato公司將信息生命周期劃分為7個階段,具體為:業務需求、采集/組織、保護/恢復、復制/鏡像、共享、遷移/歸檔、刪除。
信息只有被使用才能產生價值。在信息生命周期的不同階段,信息的價值也發生著變化。因此要讓信息快速、安全、高效的被人們使用,必須對信息進行管理。即信息生命周期管理 (Information Life Cycle Management,ILM)。
杜國強認為信息生命周期管理是一個針對信息做主動管理的策略,這個策略有以下特點:(1)以業務為中心。(2)以政策為基礎。(3)統一途徑。(4)異質環境。(5)與數據價值相關。
究其本質,信息生命周期管理是基于信息隨著生命周期其價值產生波動,根據價值的變化,對信息采取合適的措施,使組織以最低的成本獲得最大的信息價值。信息生命周期管理的目標即為使信息“在正確的時間,以正確的費用,達到正確的服務級別,確保正確的應用”。
信息生命周期管理為信息管理提供了一種思想。數字資源是信息的一種,也是目前信息存儲、傳播的主要方式。數字資源同樣具有信息生命周期的特性。借鑒信息生命周期管理的思想,界定數字資源的生命周期不同階段,并藉此采用不同的存儲策略。
要劃分生命周期的不同階段,首先要確定數字資源價值的變化。在傳統文獻資源的管理中,人們通過流通率、文獻半衰期等,觀測文獻的價值變化,安排文獻的存放和使用。在實際工作中,一些圖書館根據圖書的流通率將圖書分為一線、二線和三線,分別保存在不同的地方。一些圖書館專門開設新書閱覽室,待一年或二年后,再典藏到其他書庫。這些措施體現了依據價值存放和服務的理念。
數字資源的類別是價值變化的基礎。不同類別的信息資源的生命周期不同。網絡信息資源要比傳統資源類老化的快。以期刊、圖書、論文等為內容的數字資源的老化可以參考傳統文獻的老化規律,但又具有網絡信息資源老化的特點。
網絡信息資源老化與傳統文獻資源老化的區別在于:(1)非累積性。傳統文獻資源的重要特征之一就是其存在的永續性,即使這些載體上的知識和情報完全失去了使用價值,它也不會消失。原有信息的修正與更新、替代信息的生產以及新信息的產生必須依靠新的載體。因此,傳統文獻資源從數量上來說,總是不斷增長的。而網絡信息資源則不然。網絡環境中的信息是介于產生后永續存在與即刻消失兩種狀態之間的第三類信息,它的更新和消亡是其存在和運動的常態。在網絡環境下,新信息的出現并不一定意味著信息總量的增長,而且,相當一部分信息在喪失其使用價值之后會徹底消失,引起信息總量的減少,呈現負增長狀態。所以,我們認為網絡信息資源具有非累積性,這表明網絡信息資源的老化研究往往只能基于特定時間點或時間段,難以系統地回溯其歷史狀態。(2)動態性。動態性與非累積性是內在統一的。任何信息都是外在形態與所含內容的統一體。記錄信息的載體和信息的組織方式是信息資源的外在形態,而內容,即其所蘊含的知識和情報才是核心。傳統文獻資源的外部形態和內容是不可分割的,因而必然具有累積性。而網絡信息資源的外部形態和內容可以是相互獨立的,因此,在網絡信息資源載體的形態、信息組織方式、網址等保持不變的情況下,內容可以不斷更新,甚至刪除,這就體現為它的非累積性。眾所周知,半衰期、普賴斯指數的測定都是依據特定領域文獻資源的被利用情況,而網絡信息資源的動態性使其老化規律的研究增加了新的內容,即對網絡信息資源自身生命周期的研究。(3)不完全性。傳統文獻的生產和傳播是受控的,由相關機構統一審核和管理。因此,在傳統文獻資源老化研究中,研究對象的范圍一般相當清晰,在數量上也是可數的。而在網絡信息資源的老化研究中,研究對象的不完全性卻是無法回避的問題。導致該問題出現的原因主要來自兩個方面:一是網絡的開放性決定了網上信息的發布基本上處于不受控制的狀態,因此,任何研究者都無法確知網絡信息資源的精確構成和分布狀況,在研究特定領域的網絡信息資源時,也就不可能準確地劃定研究對象的范圍和數量。二是網絡信息資源的非累積性和動態性造成了研究對象在時間維度上的缺失,因此,在研究中也就難以系統地回溯研究對象的歷史狀態。
以此為基礎,對于期刊、圖書等類的數據庫等數字資源,參考不同學科的文獻半衰期,以及瀏覽量、下載量來確定數字資源的生命周期類型,以決定資源的存儲策略。對網絡類型的數字資源以半衰期和生存期兩個指標來衡量。
處于不同周期階段的數字資源的使用要求是不同的:“數據剛生成時,處于生命周期的早期,這個階段的數據被頻繁使用,需要昂貴的存儲技術和方式來保護數據。如RAID磁盤、復制、定時拷貝、多級備份等等。隨著數據“年齡”的增長,訪問頻率逐步降低。這時候,應該將這類數據從昂貴的磁盤遷移到較為便宜的存儲設備上,不必再進行磁盤卷以及保留幾份數據快照等。最后,當數據“老化”到不再被訪問時,就要考慮將其刪除或遷移,采用最便宜、最安全的存儲方式,方便需要時的調用”。要實現在不同時期,高效、低成本的存取數字資源,分級存儲是最佳選擇。
數據分級存儲是指數據客體存放在不同級別的存儲設備(磁盤、磁盤陣列、光盤庫、磁帶庫)中,通過分級存儲管理軟件實現數據客體在存儲設備之間的自動遷移。數據遷移的規則是可以人為控制的,通常是根據數據的訪問頻率、保留時間、容量、性能要求等因素確定的最佳存儲策略。在分級數據存儲結構中,磁帶庫等成本較低的存儲資源用來存放訪問頻率較低的信息,而磁盤或磁盤陣列等成本高、速度快的設備,用來存儲經常訪問的重要信息。
數據分級存儲的工作原理是基于數據訪問的局部性,通過將不經常訪問的數據自動移到存儲層次中較低的層次,釋放出較高成本的存儲空間給更頻繁訪問的數據,可以獲得更好的總體性價比。
數據分級存儲之所以重要,是因為它既能最大限度地滿足用戶需求,又可使存儲成本最小化。數據分級存儲的優點具體表現在:(1)減少總體存儲成本。不經常訪問的數據駐留在較低成本的存儲器中,可綜合發揮磁盤驅動器的性能優勢與磁帶的成本優勢。(2)性能優化。分級存儲可使不同性價比的存儲設備發揮最大的綜合效益。(3)改善數據可用性。分級存儲把很少使用的歷史數據遷移到輔助存儲器中,或歸檔到離線存儲池中,這樣就無需反復保存,減少了存儲的時間;同時提高了在線數據的可用性,使磁盤的可用空間維持在系統要求的水平上。(4)數據遷移對應用透明。進行分級存儲后,數據移動到另外的存儲器時,應用程序不需要改變,使數據遷移對應用透明。信息量的急劇增長,也使存儲管理復雜性增加,數據分級存儲也可大大簡化存儲管理。通過設定優化的數據遷移規則,能使重要數據和常用數據在最短的時間內訪問到,使極少使用的數據備份在廉價的海量存儲器中。
數字資源的信息生命周期管理既需要資源分類的基礎,又需要界定周期的技術指標的確定,以及存儲技術的發展和完善。信息生命周期管理是系統的管理思想,將會指導數字資源管理更好的發展。
[1]白廣思.信息資源分級存儲實現信息生命周期管理[J].情報雜志,2007(1).
[2]粟湘,鄭建明,吳沛.信息生命周期管理研究[J].情報科學,2006(5).
[3]郭松林等.網絡存儲的生命周期管理[J].福建電腦,2005(10).
[4]杜國強.信息生命周期管理[M].黑龍江科學技術出版社,2004.
[5]段宇峰.網絡信息資源老化規律研究[J].圖書情報知識,2005(4).
[6]白廣思.信息資源分級存儲實現信息生命周期管理[J].情報雜志,2007(1).