何琴
摘 要:隨著信息技術日新月異的發展,當前我們正處在大數據時代背景下,社會大眾高度重視檔案管理工作,檔案作為記錄歷史的一種形式,記載著原始數據信息的利用、收集等工作。在大數據時代背景下,各種信息量日益劇增,讓檔案管理工作變得復雜化、程序化。鑒于此。我們要立足于大數據時代背景下,深入研究檔案利用服務工作,分析大數據時代背景下檔案服務工作面臨難題,并提出相應的檔案利用服務策略。旨在希望進一步滿足用戶個性化、高層次的需求。
關鍵詞:大數據;檔案;利用服務;策略
大數據主要就是將各種先進的信息技術合理有效的應用各個領域中,促使相應領域可以及時獲取信息,高效存儲、智慧處理,精準分析多樣化、大量化、快速化的匯總信息數據。在大數據時代背景下,挖掘分析檔案信息數據有助于給企業科學決策、節約開支,創新技術等提供極大的幫助,當前我們正處在大數據時代背景下,每天都會產生海量的數據信息,故而,企業如何在海量檔案信息數據中,準確且快捷的獲取自己所需的檔案信息數據,分析數據,最大限度發揮檔案信息的作用,為企業的科學管理,戰略發展,提供強有力的數據信息支持,是非常重要的。受多種因素的影響,當前檔案服務還面臨著諸多困難。
1 大數據時代給檔案服務帶來的困境
第一,在大數據時代,如何在海量信息數據中及時準確的查詢檔案資料是當前檔案服務工作順利有序開展所面臨的最大問題。在信息時代,數據庫信息技術一日千里的發展,此形勢下各種電子文化數據不斷增長,并且信息文件保存方式也呈現出多元化。
對于現代企業而言,卡片檢索。傳統手工著錄等方式已經無法滿足現代企業的要求。雖然在大數據時代背景下,檔案管理人員可以充分利用各種先進信息技術,查詢檔案,提高了檔案查詢和管理的效率,但是在檔案數量爆炸式增長的形勢下,檔案數據出現了“脹庫”問題,在進行檔案查詢時,往往需要的息會被埋沒在大量的不需要的數據中,并且檢索性能急劇下,甚至無法響應。因此,如何在海量的信息數據中,精準獲取所需信息,是檔案管理人員檔案利用服務前必須要解決的問題[1]。
第二,面臨著如何在海量數據中抽取和挖掘有用的信息和知識的挑戰。在新形勢下,檔案管理用戶已經無法滿足對相關檔案文件的使用,一定要挖掘檔案文件中所蘊含的價值,扎這樣一來,就促使檔案管理逐漸朝著知識管理方面發展,與此同時,檔案利用服務也逐漸從提供數據轉供給知識方面發展。我們深知,知識絕對不是單一的數據信息,必須是通過深入挖掘所或缺的有價值的資料。如果單純的依靠人工挖掘信息是根本不夠的,因此,如何合理使用現代化技術有效挖掘信息,為用戶提有價值的信息,是現階段檔案利用服務所面臨的一大難題[2]。
2 大數據時代背景下的檔案利用服務策略
2.1 不斷轉變檔案業務流程
傳統檔案業務流程具體包含了檔案信息的收集、整理、存儲、利用等,在這過程中,檔案管理人員檔案主要使用的原始數據[3]。隨著信息技術的不斷發展,電子文件的廣泛使用,各種檔案數據信息量日益劇增,各種媒體形式越來越豐富,對于廣大用戶而言,傳統檔案流程已經無法滿足他們對信息數據的使用,傳統檔案流程數據使用復雜,數據查詢性能較低,有時候還會出現無法及時響應,無法使用資料的情況?;诖?,在大數據時代背景下,要不斷更新檔案數據庫,采取措施對結構進行優化,同時還可以將數據挖掘加入數據尋求前,通過這樣的方式,借助多媒體來篩選海量數據,在海量的信息數據中獲取所需信息數據[4]。此外還需不斷優化數據查詢性能,從整體上促使檔服務的提升。唯有如此,才能進一步解決檔案利用服務問題,促使檔案利用服務效率的提升。
2.2 數據挖掘的合理應用
一些沒有經過處理,或是不完整的數據信息中,提取有價值的信資源,科學合理對挖掘數據進行分類,在這過程中,第一種是web數據挖掘,另一種是結構型數據挖掘和文本數據挖掘,在檔案管理中合理使用數據挖掘技術,能進一步縮短檔案管理的時間,及時提取檔案信息資料,最大限度的滿足檔案工作效率要求。文本檔案在數據挖掘中是最基礎的部分,同時文本檔案也是數據提取過程中非常普遍的一種技術[5]。檔案管理人員通過分析文字,能夠得到有用信息。在提取有用信息的過程中,主要有兩個步驟,第一,就是分類,第二,就是預測,數據分析是文本挖掘的基本要素,該步驟具有消除衍生語言的具體特點,之后再將這些信息放入到數據庫中,實現結構化數據的目的。最后還必須要通過信息傳遞或是評價方式完成數據挖掘。我們可以將“高品質”文本挖掘理解成是一種相似形式中實用性和關聯性的組合,在大數據時代,檔案文本數據挖掘的過程是很普遍的,比如,聲像數據轉換、數理統計等,這些數據轉化主要是采用文本形式來處理的。其具體存在以下兩方面,一是知識發現,另一方面是信息訪問。
2.3 數據挖掘平臺的使用
要想從整體上提升檔案服務質量,數據挖掘技術是非常關鍵的,眾所周知,文本智能數據處理主要是基于音頻識別技術和獨特模糊識別所構建的。其作為數據挖掘平臺的中心,檔案管理人員可以通過調取數據挖掘平臺的中心的內容,進一步分析需信息。從而提供用戶搜索應用服務,實現數據收集、挖掘、智能搜索等一系列的環節,為檔案使用人員提供檔案服務,另外,還可以將相關數據結果直接有效地顯示在數據挖掘平臺上。在這過程中,檔案資源數據挖掘,具體包含了以下幾點,第一,檢索音頻內容,自動識別關鍵,企業可以進一步區分定位視頻當中不同的內容,促使視頻處理能力的提升,第二,檢索語義,作為當前檔案管理中最常見的一種搜索方式,我們在使用這種方法的過程中,只需要提供計算機識別語言。第三,檔案智能化輔助分類,這種方式,主要就是指工作人員從平臺中,提取檔案,借助數據挖掘平臺的中心現文獻的自動分類,利用數據平臺分類,促使了檔案準確率的提升,同時還能支持多維度動態分類。作為構建在數據挖掘的平臺的載體,文本數據處理層目的就是以概論和特殊信息論為基礎,檔案管理人員在具體的工作中,借助相關技術,提供搜索應用服務,提取所需信息,這樣一來,他們就可以在數據挖掘平臺合理使用智能搜索、數據分析、數據挖掘以及采集數據應用平臺,在采集平臺上進一步完成層次化數據采集。
3 結語
綜上所述,當前我們正處在大數據信息時代背景下,面對海量、形式多樣的檔案信息,導致檔案管理人員無法及時在海量信息中找到所需信息,信息查詢性逐漸下降,有時候還會出現無法相應等問題,加之傳統檔案查詢服務模式已經無法進一步滿足時代發展的需求,基于此,我們必須要分析大數據時代背景下檔案利用服務所面臨的問題,針對問題,采用文本挖掘、數據挖掘,進一步發掘檔案之間的關聯,最大限度挖掘檔案信息中所蘊含的知識,之后在利用智能化處理平臺推送給用戶,最大限度的滿足用戶需求。
參考文獻
[1]余紅光.關于大數據時代背景下的檔案利用服務分析[J].黑龍江史志,2015(3).
[2]朱建華.面向大數據的檔案信息資源服務與利用[J].信息與電腦(理論版),2014(8):46-47.
[3]楊菁華.基于大數據環境下檔案利用服務體系的建設[J].才智,2018(9).:75-77.
[4]王曉輝.大數據技術下服務導向型檔案利用管理策略[J].蘭臺世界,2019(6):109-111.
[5]魏振國.基于云計算大數據背景下檔案信息資源共享模式初探[J].機電兵船檔案,2019,200(01):102-105.