吳東婷
(中國航空發動機研究院,北京 101304)
隨著科學技術的深入發展,大數據技術打開了時代的新篇章,得到了全世界研究人員的重視。大數據概念于2008年提出,研究人員還對大數據的相關技術進行了長時間的調查研究。大數據主要是收集數據和關聯數據,最為顯著的優點便在于量大、高速、多變,能夠存儲海量數據、分析海量數據。大數據技術的研制對我國社會、經濟的發展都有著十分重要的影響,對各行各業的發展都是一場重大變革。
大數據技術的運用能夠科學合理地解決人們的難題,為其提供新的思想方法,當前大數據的“預測”思想已經成為一種新型的社會現象,能夠在潛移默化中對人們的思維方式和生活方式帶來翻天覆地的變化。檔案作為人們社會活動中形成的具備保存價值的原始記錄,必然會呈現出大數據時代的新特點。
在大數據時代背景下,我國的檔案數字資源建設可以將其分為兩個部分,一種是增量檔案電子化,另一種是存量檔案電子化。根據國家檔案局的資料調查顯示,我國企事業單位、各級檔案館均有著豐富的館藏檔案資源,而在數字化時代下可以將檔案資源轉變為檔案數字資源。電子檔案數量大幅度增長,這是因為電子檔案的儲存包括了電子文件、聲像、圖標、數據庫等,同時也涵蓋了紙質檔案時代的原始記錄,例如瀏覽軌跡、日志等。眾所周知,大數據技術的運用能夠深入挖掘人們未能發現的潛在價值的檔案信息,所以需要重新鑒定數據的檔案屬性,在檔案領域中增添海量數據[1]。
在大數據時代背景下,人們對于各個領域的探索逐漸加深,對于探索中數據的保存能力也得到了增強,檔案的來源也將愈加豐富,移動終端的運用更是展示了數據產生的多樣化特點。由此可見,在大數據時代中所產生的檔案數字資源將存放于不同的信息系統中,展示結構化信息、半結構化信息、非結構化信息相融合的發展趨勢,產生大量的異構數據。
在大數據時代背景下,面對著大量的數據來源,信息的價值密度逐漸下降,人們對于外部世界的了解需要通過更加詳細準確的信息數據來加深認知,從而進行合理的決策判斷。而檔案作為人們快速了解世界的重要工具,是人類社會極為重要的本源信息,在面對人們的需求時能夠充分發揮自身的優勢,也就是網絡信息資源無法比擬的真實性、可靠性、權威性。因此,在大數據環境中,人們越來越重視檔案的價值,以及檔案在人類社會發揮的作用。
不管是數字形式的數字檔案信息,還是由傳統載體檔案信息轉變成的數字檔案信息,其數字格式和檢索工具都不一致。例如,文本格式有TXT、PDF、DOC,而檢索工具也分為全文檢索、目錄檢索、主體檢索等[2]。所以不能夠使用統一信息平臺的管理系統來管理和利用數字檔案信息。
大數據時代是一個信息化、知識化的時代,隨著信息技術的創新升級,檔案數字資源的來源結構也產生了巨大改變,使用傳統的數據挖掘算法對于非結構化數據進行分析是存在很大的局限性的。在大量的檔案數字資源中要想獲得有價值的信息,就需要關注檔案數字資源中的數據關系與語義表征,實現信息整合和知識整合。但是當前檔案數字資源整合還只是在數據整合的階段,只能夠為用戶提供信息檢索的服務,還未能滿足大數據時代的發展要求。
在大數據技術的創新發展中,數據信息已經呈現“爆炸”發展的形勢,檔案信息是以認真嚴謹的態度來保存國家和社會個人的發展和經歷的真實的歷史記錄。檔案數據信息與其他資源不同的是檔案數字信息包含了大量的重要機密信息,同時還存儲著每一個人的個人隱私、工作信息等資料,與國家民生的發展息息相關。在大數據時代背景下在,怎樣更好地劃分檔案數據信息敏感資料的使用權和所有權?怎樣的安全防護措施才可以滿足數據信息非線性增長的需求?怎樣的方法才可以科學有效的處理大數據信息資源分布式造成的隱私泄露風險?這些問題都是大數據時代檔案數字資源整合的難點[3]。
在大數據時代背景下,檔案數字資源管理不再是傳統的管理模式,對于檔案管理人員也有了更加嚴格的要求。檔案管理人員需要全面掌握數字檔案資源的分類存儲和整理工作,通過科學合理的關聯,進一步抓取有用的信息。因此,檔案數字資源整合需要有具備檔案管理專業知識和數據分析能力、處理能力的復合型人才來擔任該項工作,目前檔案管理部門正缺少這類復合型人才,也是制約檔案數字資源整合的因素之一。
在大數據時代,由于檔案數字資源具備數據量大、飛速增長、分布廣泛、多源異構、真實可靠、價值重大等特征,這給檔案管理人員開展檔案數字資源整合工作帶來了挑戰。因此,檔案管理人員需要針對檔案數字資源整合難點,進行分析研究,積極探索找出科學合理的解決對策。
大數據技術正在飛速發展,同時也給檔案數據信息給予了新的定義,要想整合檔案數據信息資源,就需要保證檔案數數字信息的質量和數量,需要創新檔案管理工作人員的檔案資源管理意識和理念。在大數據技術的引領下以正確的工作態度來增強檔案管理人員的法律意識,創新發展觀念。運用大數據技術來實現數據信息的集成服務,并根據數據信息挖掘等技術來進行檔案信息資源的定向服務。此外,在檔案數字資源整合管理中,需要按照用戶的真實需求為其提供學術信息資料,有利于檔案用戶創設資源數據庫列表以及個人數據信息電子列表等功能。對于檔案數據信息的組成結構和存儲模式進行重新審視,轉變傳統的存儲模式,強化對檔案信息資源潛在價值信息的關注。
從技術角度來考慮大數據時代檔案數字資源整合,其重點在于通過云計算技術和大數據處理工具等手段建立檔案數字資源分析系統。云計算能夠滿足大數據分布式的存儲和大量數據處理的需求,促進檔案信息資源實現服務化。同時云計算可以將業務邏輯、組織結構、表達方式進行統一,從而建立集成的檔案數字資源管理平臺,實現檔案數字資源整合和知識開發[4]。此外,云計算能夠整合檔案應用,通過服務的方式向用戶進行發布,還可以幫助用戶通過移動終端設備來進行云服務。
現如今檔案數據信息多元化已經成了現實,要有效地整合檔案數字信息資源,就需要用戶和管理者的共同努力,創設服務需求的大數據檔案資源整合標準體系結構,實現不同模式信息的有效整合。此外,在檔案數據信息的管理中需要建設檔案數字資源整合安全保障體系,通過設置身份、訪問管理系統,認證用戶的身份信息,對其設置訪問權限,以此達到使用人員安全集成的目標,在檔案數字信息資源和大數據技術的結合中控制好安全風險。在安全保障體系的建設中還可以選擇數據加密技術來提升檔案數字資源的安全度,通過加密環節在數據庫中的每一個位置節點加強保護。不僅如此,還需要根據大數據技術和安全信息防護方式,來管理和監督檔案數據信息資源,通過行之有效的手段措施來保證檔案數據信息資源的安全性,防止泄露風險。
檔案管理工作的核心在于“人”,通過建設檔案工作人員隊伍,來增強檔案工作人員的綜合素質,打造一支既熟悉檔案業務,又具備信息化技術技能復合型人才隊伍,這樣檔案管理部門才能夠快速適應大數據時代背景下數字化制造提出的嚴格要求。作為檔案管理部門中檔案管理的工作人員首先需要轉變工作觀念,提升自身檔案數字信息管理的專業素養和業務技能,全面掌握數據整理和分析、計算機、網絡等專業知識,強化數據管理的知識發現能力,在處理龐大的檔案數字資源時,需要善于運用自身的專業知識來獲得有用知識并將其通過科學的手段提供給用戶,以此滿足用戶多樣化、個性化的檔案信息需求。檔案管理部門可以通過開展專業培訓,如檔案業務研討會、專題培訓和專題調研等方式讓檔案管理人員盡快掌握專業能力。此外,還可以建立人才引進和管理制度,吸引更多的信息技術、網絡技術等人才,通過設置考核機制和獎勵機制來促進檔案管理人員隊伍多元化發展[5]。
總而言之,檔案數字資源整合是大數據時代檔案事業發展的重要的一項環節,同時也是檔案部門轉變管理模式、提升業務技能的一步。所以檔案管理部門管理人員除了檔案業務知識外,還需掌握云計算技術、大數據處理技術等先進信息技術,深入研究探索檔案數字資源整合在其他領域的運用,從而探究大數據時代檔案數字資源整合的理論體系和措施,促進檔案服務理念的創新發展和服務方式的轉變升級。