周玉敏
近年來,隨著科學技術的迅猛發展,網絡和信息技術迅速滲透到各行各業,并成為改變人們工作方式、思維方式的重要手段。在新的工作和生活方式的改變進程中,產生了大量的行為痕跡,這些痕跡以數據的方式存放于服務器中。這就是人們常說的“大數據”。國家檔案局局長李明華2017年12月27日在北京召開的全國檔案局長館長會議上表示,我國檔案工作要應勢而動、乘勢而為,加快轉型升級,逐步實現以信息化為核心的檔案管理現代化。
1 大數據為檔案工作帶來新的挑戰
1.1 檔案數量呈爆發式增長。隨著無紙化辦公的發展,一些地區和部門實行雙套制歸檔,檔案不僅以紙質形式存儲,更以電子文件的形式運轉和留存。各級檔案館接收進館的檔案亦增幅可觀。據統計,2008年,全國各級國家綜合檔案館館藏1.93億卷,較上年增加1769萬卷,增幅達10%;2011年,各級國家檔案館館藏已達3.3億卷;據預測,到2020年,各級國家檔案館館藏將達到6億多卷。而我國檔案數據不僅局限于檔案館館藏,還廣泛存在于政府、企業、金融、教育等各行業的檔案室中。可以預見,檔案數量將呈爆發式增長。
1.2 檔案種類紛繁多樣。由于檔案廣泛存在于各行各業中,政府機關、金融、通信、建筑、教育、法院等行業產生的檔案種類各不相同,如文檔、圖紙、照片、音頻、視頻、GIS信息、水文氣象信息等。檔案種類從以文書檔案為主向表格、網頁、音視頻、圖像等類型的數據傾斜。如何收集、管理、保存這些種類的檔案,是我們急需解決的問題。
1.3 檔案利用需求多元化。為群眾提供利用服務是檔案館的一項日常工作,也是檔案為各項事業服務和百姓服務的直接手段。隨著檔案資源的不斷豐富,檔案利用的主體已由各級行政機關擴展到全社會,并且社會普通民眾的利用比率逐年上升。普通民眾利用的檔案內容呈現出多元化的特點,涉及房產、婚姻、兵役、招工等各種民生檔案和專業檔案。如何更好地提供利用服務是我們面對的問題。
2 大數據為檔案工作帶來新的機遇
2.1 大數據為檔案數據挖掘帶來新的機遇。數據挖掘又稱為資料探勘、數據采礦,它是數據庫知識發現中的一個步驟,一般是指從大量的數據中自動搜索隱藏于其中的有著特殊關系性的信息的過程。這些數據可以是結構化的,也可以是半結構化的,如文本、圖形、圖像數據,甚至是分布在網絡上的異構型數據。通過數據挖掘,可以做出預測性的、基于知識的決策。檔案館以及各行業的檔案室擁有大量的數據資源,在大數據時代,這些數據資源可以從孤立的信息變為具有相關性的網狀數據關系,在醫療衛生、社會事件、政府決策等方面做出預測和參考,從而發揮檔案服務中心工作的作用。
2.2 大數據為檔案利用服務帶來新的機遇。傳統的利用服務是群眾到檔案館或其他檔案保存機構現場查閱檔案,既費時費力又難以達到滿意的效果。而大數據時代的到來,利用互聯網和信息技術,群眾可以在線查閱電子檔案,既省時省力,又減少了對檔案的損害。同時,可以對檔案查閱信息進行二次數據挖掘,對利用檔案的種類、人群分布、查閱時段等進行分析,有針對性地開展檔案鑒定、開放和編研工作,以擴大檔案在社會上的影響。
3 大數據促進檔案行業加快轉型升級
3.1 大數據促進檔案工作模式改進。傳統的檔案工作模式由收集、管理、利用三個主要環節構成。其中,收集由各檔案產生部門分別收集,整理后移交至檔案保管部門;管理以人工手動管理為主,建立紙質的管理流程;利用是以人工手動查詢檔案實體的被動利用方式為主。而在大數據時代,檔案的收集是自動形式的實時收集過程,其目標數據不僅是結果,而是檔案產生的整個過程;檔案管理是智能化的機器管理過程,管理對象不僅是檔案實體或電子文件,也包括對檔案進行諸多操作的痕跡管理;檔案利用則是依靠數據挖掘、云計算等信息技術對數據的分析和預測。
3.2 大數據促進各類型檔案管理標準規范。由于大數據時代的到來,檔案產生來源更為廣泛,各種類型的檔案如何管理迫在眉睫。尤其是利用率較高的民生檔案和專門檔案,由于劃分細致,各具特色,急需更具操作性的檔案管理標準來規范管理。
3.3 大數據促進檔案法規逐步健全。由于檔案具有保密性和安全性的屬性,在利用過程中要注重安全性問題。特別是以互聯網為運作環境的大數據時代,網絡環境的開放性對檔案的安全保密會形成一定的沖擊。如何在安全的前提下,保存檔案資源的真實可靠性是必須解決的問題。因此,要提高安全防范意識,建立健全和不斷完善相關檔案法規。比如在安全管理制度、配備安全管理設備、系統的安全防護和保密管理條件等方面做出具體規定,查處違法行為。
(作者單位:新密市尖山風景區管理委員會 來稿日期:2018-01-26)