摘 要: 在信息化大數據時代,人們習慣了運用便捷直觀的方式處理信息,傳統的紙質檔案的信息檢索方法與處理技術顯得非常的耗時費力,難以能滿足人們運用檔案信息的技術需求。立足互聯網信息技術優勢,開發檔案信息的數據庫,實現查閱檔案的新信息技術化手段,在檔案信息挖掘和大數據的創新應用方面,取得顯著成效。本文分析了檔案信息的大型數據庫挖掘技術可行性,提出了積極地建議,展示了廣闊的應用前景。
關鍵詞: 大數據;檔案數據;數據挖掘
1 大數據技術的概念。
人們利用信息技術建立資源龐大的信息庫,形成較為豐富的大數據,以網站、網頁和相關軟件的方式,高密度匯集各個領域的數據信息,形成人們共享的信息資源,由于該數據庫是眾多信息資源的整合與收集得來的,故稱為“大數據”,其實,就是信息資源庫的一個稱謂。
1.1 大數據的時代背景。
隨著互聯網信息技術的廣泛應用,計算機、智能手機的普及,人們的生產生活的各個方面,幾乎離不開數據信息的應用。因此,大數據的開發應用勢在必行。大數據的建立,方便了人們的快速了解各類信息,提高了人們知識面,擴大了人們的認知范圍和空間。
1.2 、大數據的內容。
大數據的主要內容就是對模塊數據信息的有機整合,建立規范的數學模型,對原始數據信息進行分析、處理,是互聯網計算機技術支持條件下的新興的智能技術的應用形式和手段,為人們提供快捷便的信息服務軟件設備。
1.3 大數據技術具有的的基本特征
一是信息容量十分龐大。每一個數據庫都會有很多的信息模塊,每一個模塊又包含門類齊全的各種信息;利用芯片對龐大的信息群體集中整理和歸類收集。二是信息的多樣化。不同的網站、不同的行業都有不同門類的數據庫,信息資源共享程度較大,呈現不同方面、不同門類多樣化的的信息。三是應用價值很高。各種信息資源的共享,方便了人們的生活、工作和學習,應用價值性極高。
2 檔案數據信息的挖掘技術
2.1 基本概念。
紙質或實物檔案再利用過程中,信息檢索非常麻煩,要根據需要信息的門類、條款,逐一檢索,耗時、費力,還往往出錯,影響工作效率。互聯網計算機技術的廣泛應用,為檔案信息數據技術的開發創造了條件。檔案數據信息挖掘技術,就是利用信息技術構建檔案檢索體系具體實踐。
2.2 該技術的內容特點
檔案從紙質文字和實物信息開發為規范的數據信息,其技術特點一是工程量大;二是開掘過程十分復雜;三是能夠利用相關軟件優化模型;四是能夠對相關信息進行分析和處理;五是由于信息量過于龐大,細微的錯誤在所難免。
2.3 該技術的實踐應用
檔案數據信息開掘技術的實踐應用,表現了信息技術很多優勢,對檔案資料的開發應用提供了新的平臺。一是該技術根據不同用戶的相關的不同需求收集和處理大量的信息,完善充實檔案數據庫,確保檔案數據信息的個性化處理;二是實現了信息共享,不同用戶、不同信息模塊之間相互關聯,信息共享。所有的檔案信息都可以進行全網搜索。三是軟件系統能夠自動把相似信息實施歸類匯總,匯集于一個信息模塊,以方便人們利用檔案過程中,效率更高,查閱檢索更方便。
3 大數據條件下檔案數據信息挖掘系統和挖掘技術
3.1 大數據庫中檔案數據信息挖掘系統
3.1.1 關聯規則用于檔案數據挖掘
關聯規則就是在大量的信息中,把關聯密度較大信息,進行有效組合,利用信息技術歸類整理,突出特別的效果。在檔案數據信息挖掘過程中,利用關聯規則,主要就是把不同用戶信息實施整合處理,通過這些信息分析和預測用戶的生活和工作的特征、狀況。有效的輔助檔案的運行和管理。其顯著的技術優勢,就是能夠挖掘相關聯的信息,滿足客戶的延伸需求。
3.1.2 分類信息化技術用于檔案數據挖掘
進行檔案數據的開發挖掘處理,也可以按照一定的標準對用戶人群實施分類,參照不同人群不同的信息處理方法以及不同的檢索條件,使用戶分類更為細致。憑借更細的分類結果,更方便對各種不同信息的了解,明確不同用戶間的相互關系,并進行合理的分組整合,創建信息索引條目,以輔助檔案的利用。
3.1.3 分層聚類方法用于檔案數據挖掘
在檔案數據信息開掘過程中,用聚類分割的方法比較不同的檔案數據信息處理程序,進行優化處理,完善需要的分類表,突出科學、高效的特點,這種技術方法可以說是最簡便、最優化的技術措施,用于檔案數據信息的開掘較為適合。
3.2 大數據庫視角下的檔案數據信息挖掘技術
3.2.1 庫存管理技術。
一般的庫存管理技術,在信息的綜合運用上,有獨特的優勢,該技術應用于檔案的管理數據信息的開掘中,適應了檔案數據信息的實際開掘需要,該技術信息存儲量極大,而且門類分工規范,信息模塊既分割又關聯,能獨立運用,又能資源共享。
3.2.2 空間檔案信息挖掘技術
這種技術是新興的數據信息技術,目前,理論體系和應用體系尚不健全,屬于實驗應用階段,從實際發展的狀況來看,該技術用于農業、軍事的檔案資料數據化構建,有著廣闊的發展前景。空間檔案信息挖掘技術的應用在廣泛程度上,現階段與庫存管理技術沒有可比性,但從長遠發展進行比較,前者的優勢遠遠強于后者,開發空間和開發利用潛力相當大。尤其適用于檔案數據開掘的需要。
結 語
信息化時代,大數據技術的廣泛應用,創新拓展了人們的生活、生產和學習的空間,檔案數據開掘就是一個具體的實踐,需要人們在不斷地研究探索中,進一步開發新的形式,使各類服務更人性化。
參考文獻
[1]魏巍.基于大數據的檔案數據深度挖掘的探索[J].黑龍江檔案,2017,(06):66.
[2]吳曉文,孫杰,楊帆.大數據背景下海洋檔案數據挖掘研究[J].辦公室業務,2017,(19):186-187.
[3]張偉.檔案大數據挖掘流程與技術研究[J].蘭臺世界,2017,(17):35-38.
[4]王春英.大數據技術在檔案管理中的應用研究[J].黑龍江檔案,2016,(02):48.
作者簡歷
姜冬梅(1973.01),女,漢族,山東省煙臺市人,煙臺市萊山區政務服務管理辦公室科長,館員,大學本科,研究方向為檔案管理。