郭津鋼
摘 要:大數據時代下檔案數據資源體系變化的研究,有利于保護各類檔案文化資源,優化檔案業務流程,挖掘檔案增值信息,加強檔案管理機構的職能建設,達到促進檔案事業發展的目的。擁有可觀的館藏資源是檔案部門開展工作最大的優勢,館藏資源越多越能體現檔案部門存在的價值,豐富的館藏是檔案部門維護社會地位的根本,也是開展檔案利用服務的資本。大數據時代,信息資源呈現爆發式增長,最終作為檔案保存下來材料的也急劇增長,檔案不再缺,而是泛。檔案數據的來源更廣泛、內容更豐富、采集方式也發生了改變。
關鍵詞:大數據;時代;檔案數據;資源體系;變化
大數據時代,社會各行各業都逃不開大數據的侵襲,面臨著對紛繁復雜層出不窮的數據進行分析和處理的困境,同時還面臨著大數據時代給工作帶來的各種改變,作為主管國家信息資源的職能機構,肩負著國家、社會、人民賦予的使命,檔案部門同樣也面臨著大數據時代給檔案管理帶來的各種變化,如新生的理論觀念、增多的數據資源、變換的服務方式、難度增大的安全保衛以及行政機構的準確定位等等,這些變化都需要檔案部門對大數據時代的檔案管理工作重新進行認識和分析。
一、檔案數據的來源更廣
檔案館是集中統一永久保管黨和國家檔案的科學文化事業機構,是科學研究和社會各界利用檔案史料的中心,所以檔案過去的功用主要體現在維護和傳承黨和國家的記憶上,這在一定程度限定了檔案的來源,它們大多都是機關、企事業單位經年累月后精挑細選的“成品”,大數據時代,檔案數據的來源更多地傾向網絡化、社會化、平民化。互聯網的普及、網民人數的增多以及網頁數量的暴漲使得網上信息成為了檔案數據的主要來源之一。
檔案部門更關注民生民意是檔案數據來源的另一大變化。這幾年,檔案部門積極響應國家政策,更加注重收集關乎老百姓切身利益的民生檔案。國際檔案日的宣傳主題從“檔案在你身邊”到“走近檔案”,都是在呼喚大眾的社會檔案意識,引導他們關注檔案、關心自我。日常生活中,日記照片、錄影錄像、獲獎證書、購物發票、就診記錄、行車線路、消費信息等等都和自身息息相關,雖然這些信息對他人毫無用處,但它是自己歷史的一部分,對自己有重大意義。國家號召全社會建立家庭檔案和個人檔案,“全民皆檔”使得檔案來源更草根化、生活化。
二、檔案數據的內容更豐富
對于檔案部門來說,信息資源是安身立命之本,檔案數量越大、門類越多就越有利于檔案價值的發揮,強化檔案部門的社會地位。大數據時代早已讓 IT 行業風起云涌,后知后覺的檔案部門受到大數據的影響,檔案數據本身也發生了變化。一是檔案數據數量增大。大數據時代,檔案數據資源總量大且迅猛增長。但個檔案館的館藏檔案數量不算大,但全國各個檔案館館藏檔案的總和就可以稱得上大數據。數據時代,隨著全國各級各類檔案館的擴改建工程項目從開始啟動到逐步完工,檔案館館藏容量大大增加,檔案館勢必要全面完成存量數字化、增量電子化任務,且在今后乃至很長一段時間內檔案仍將實行“雙套歸檔制”,這些移交、寄存、撤轉并改檔案數量輕易就能使檔案館館藏存儲量達到 TB 甚至 PB 級,形成海量規模。二是檔案數據類型增多。檔案館的館藏檔案通常包括紙質、聲像、實物幾個常見種類,信息化又帶來了電子檔案,還有用戶信息、瀏覽查詢痕跡等等需要保存,這些載體各異、特征多樣,結構差異大的檔案被分門別類用不同方式保管著,數據和載體的增多使得同一個信息可以用不同的數據形式表示出來,同樣的數據形式也可以表達不同的信息內容,它們共同組成了檔案館的異構數據大集群。三是檔案數據價值密度降低。檔案作為最真實的歷史記錄,相較于一般的信息資源擁有非常高的價值。但大部分的檔案一旦移交進館后就基本處于休眠狀態,乏人問津少有翻閱。實踐證明,利用率高利用價值大的檔案在館藏檔案中幾乎如鳳毛麟角般稀少,這些重要檔案占全部庫存檔案的比重非常低,檔案價值密度的高低與檔案數據總量的大小成反比,表示說檔案數據總量越多單個檔案的價值密度就越小,其中還不乏長期處于沉睡中從來沒有發揮過作用的,它們其實占據了檔案總量的大部分。大數據時代,檔案數據總量只會逐年驟增,相對來說檔案整體平均利用率就會降低,那么可能有用的檔案對應比例就會減少。四是檔案數據處理速度加快。隨著檔案信息化進程加快和檔案網絡的逐步建設,檔案部門已經漸漸脫離了人工手動管理檔案的落后方式,進入了了現代化的檔案收、管、用業務流程管理。大數據時代,檔案工作講究的是時效性和便捷性,一方面對稍縱即逝的有用信息的抓取速度提出了新要求,尤其是網絡中更新快的網頁信息,另一方面要求檔案員從海量檔案中迅速找到用戶所需的信息。如何快速獲取有效信息并滿足用戶需求,只有靠大數據催生出的云計算技術來解決自身帶來的難題,運用互聯網技術、計算機軟件、高科技手段提升檔案資源的處理速度。
三、檔案數據的收集方式多樣
信息資源數量再多,沒有被收集歸檔就不是檔案,就不能起到檔案作為權威的作用。檔案業務工作的第一環就是檔案的收集,在傳統的管理方式下,收集主要靠的是主動移交,單位各科室定時向綜合檔案室移交,各單位定時向各級國家綜合檔案館移交,還要打好移交清冊,以免損毀丟失。
第一,檔案數據的強制收集。事實上,很多單位都不主動向檔案館移交檔案,借故拖延,加上檔案法規威懾力弱,檔案部門不主動上門要,很難及時將檔案收集齊全完整。第二,檔案數據的實時捕捉。如今互聯網信息內容多、更新快、傳播廣,成為檔案部門在大數據時代檔案收集的重點和難點區域。將有價值的信息及時捕捉歸檔,對檔案員的專業敏銳度和操作靈活性是一大考驗,因為不知道一閃而逝的信息在什么時候有用,檔案部門再也不能只依著“等人送上門”的老辦法來收集檔案,采用收集信息的新方法,實時把握網絡動態資源,借助計算技術和信息技術的力量,充分利用社會計算,幫助檔案員實時對網絡資源進行科學捕捉。
大數據時代下的檔案管理是檔案界一個全新的研究領域,正確認識大數據時代給我國檔案管理工作帶來的變化,這就要求我們用發展的視角去認識檔案價值,用創新的思維去拓展檔案領域,用科學的方法去提高檔案工作水平,用變革的技術去提升檔案管理能力。
參考文獻
[1]潘連根.我國檔案學研究的現狀及發展趨勢.北京檔案,2008
[2]朱玉媛.論檔案學研究體系的構成要素及其相互關系.檔案學通訊,2009