李改英
摘要:信息時代背景下,信息分析與處理方式多式多樣。大數據技術近幾年開始應用于檔案數據挖掘中,使得檔案管理工作變得信息化和精細化。本文就大數據技術在檔案數據挖掘中的價值與策略進行深入分析。
關鍵詞:大數據技術;數據挖掘;檔案信息
伴隨著大數據時代的到來,數據挖掘技術在檔案管理中的應用將進入一個新的發展時期。盡管檔案學術界很早就提出知識管理與知識挖掘,但知識挖掘尚停留在概念和理論探討階段[1]。大數據挖掘,即從大數據中挖掘知識,大數據挖掘技術有效地解決了數據和知識之間的鴻溝,是將數據轉變成知識的有效方式。大數據時代給數據挖掘技術帶來的根本性改變是使數據的深度挖掘成為可能,對大量數據進行分析處理和智能化挖掘,從管理角度來看,要達到最優的結果,不僅數據要全面、可靠、有價值,而且需要對數據進行深度挖掘[2]。
一、大數據技術與檔案數據挖掘內容
(一)挖掘檔案資源
在大數據技術支持下,檔案管理工作的思路應轉變為“大數據”,合理整合檔案數據,建立完善的大數據檔案資源體系和共享軟件檔案數據資源庫,從而實現館藏檔案的共享和聯系。另外,云計算平臺和互聯網技術等推動了地區檔案數據資源網絡系統的建設與完善,使得檔案用戶查詢相關資料更加方便簡潔。
(二)用戶數據挖掘
大數據技術下的檔案資源挖掘,可以挖掘更多的用戶數據,使得大數據檔案服務變得更加精準,同時也提升了用戶的體驗感與認同感。在進行檔案數據挖掘的時候,應該重點對用戶的檔案信息、用戶統計資料等進行挖掘整理。在檔案數據挖掘的時候,可以利用大數據技術訪問用戶的瀏覽日志文件,還可以用數據分析技術進行檔案資料分析,對用戶的檢索關鍵詞進行數據化統計,從而提高檔案信息查準率。
二、利用大數據技術進行檔案數據挖掘的有效措施
(一)構建大數據技術為核心的數據資源體系
隨著社會的進步,檔案數據應展現時代特色,構建中華民族體記憶的“中國式”數字資源庫[3]。數字資源可以是文本形式、音頻形式、圖片形式等。首先,應擴大檔案數據資源總量,加大實體檔案資源的建設,完善實體檔案門類,優化館藏檔案結構。其次,應重點建設數字資源,構建完善的數字化檔案資源庫,使電子檔案分門別類的歸檔。最后,應大力整合檔案數據資源,實現資源共享,增加數據應用價值。一方面,在檔案數據管理方面,大數據技術為檔案管理與檔案挖掘提供了有效保證,另一方面,在大數據技術下檔案的深入挖掘中,還進一步優化了檔案館的使用功能。
(二)構建和諧的用戶關系管理,增大數據內在關聯
在大數據時代,人們應該轉變原有的“因果關系”認知思路與觀念,用“相互關系”取代傳統思想,用新的視覺看待檔案數據挖掘,用新的技術去挖掘檔案數據,將以前的“知道為什么”變成“知道是什么”大數據技術有預測分析的功能,可以對檔案用戶之前的網上行為,現在的進行行為進行分析,還可以根據用戶的基本情況預測未來的行為,挖掘出數據之間的關聯性,實現檔案資源的集成、創新與優化。可以借助大數據技術,統計分析用戶的行為軌跡,研究用戶的使用習慣和興趣,分析用戶的儲存行為等,在隱性層面滿足用戶的實際需求。例如,借助大數據技術針對不同的用戶,可以產生動態推薦超級鏈接列表。
(三)利用大數據技術保護數據安全
在大數據時代,信息隱私安全保護面臨著嚴峻考驗,技術因素和人力因素都會影響數據的安全性,如果合理利用大數據技術,就可以為檔案管理工作提供可靠的預測決策的情報。首先,應健全大數據檔案挖掘法律法規,加強對個人檔案信息隱私的保護力度,另外,還應建立個人檔案數據安全管理體系,合理管理檔案信息,避免發生數據外泄和丟失等現象。其次,選擇可以保護數據隱私的挖掘方法與技術,明確私人信息和公共信息,先確保私人信息的安全,再進行數據深入挖掘。
(四)實施智慧因子聯合大數據技術的數據挖掘模式
自“智慧城市”概念提出后,“智慧因子”被廣泛應用于各行各業中,例如智慧上海、智慧物流、智慧檔案館等[4]。智慧檔案館就是檔案數據挖掘中“智慧因子聯合大數據技術”的實際應用案例,在大數據技術中植入智慧因子,將智慧服務為檔案館理論,在互聯網技術和物聯網技術的支持下,形成智能網絡體系,真正實現檔案信息資源的有機整合和廣度挖掘,推動我國檔案服務的信息化和智慧化發展。大數據技術可以將各種檔案資源進行有機整合,同時,借助智慧因子,創新智慧服務理念和手段,使得檔案數據資源開發更加個性化,同時讓隱性知識變得顯性化。
三、結語
綜上所述,在大數據時代背景下,大數據檔案、大數據服務、智慧檔案等都大大促進了檔案管理工作的發展。隨著科學技術的不斷發展,未來檔案管理工作中應真正落實大數據技術,使得每位檔案管理人員在工作中都可以輕車熟路。檔案數據挖掘有幾個不同的環節,在應用大數據技術的時候,應該認清數據挖掘環節的特性,采取合理的數據挖掘措施,實現檔案數據資料的有效挖掘和合理運行,實現大數據技術下檔案數據的良性循環。
參考文獻:
[1]楊來青.大數據背景下檔案信息資源挖掘策略與方法研究[J].中國檔案,2018(08):60-61.
[2]陳水湖.試論大數據環境下的檔案“數據化”管理[J].機電兵船檔案,2018(02):69-72.
[3]梁雯.大數據視域下檔案數據管理的創新策略研究[J].科學大眾(科學教育),2018(01):184.
[4]吳曉文,孫杰,楊帆.大數據背景下海洋檔案數據挖掘研究[J].辦公室業務,2017(19):186-187.