吳衛 倫鳳梅 宋曉淳 路紅華
摘 要:在大數據時代的來臨之下,所帶來的數據量極為龐大,生成速度較快,同時擁有較高的價值,如今大數據的系統已邁向更多的應用范圍,進行重復的使用,往較高的方向發展,并且通過互聯網技術和信息技術的加強,與其進行合作,獲取信息的重要性尤為重要,其重要性也較為突出,同時對高效檔案的信息的價值也有明顯提升,本文從大數據的特點開始,總結大數據環境下高校檔案信息資源的集成與服務的主要特點和內容。
關鍵詞:大數據時代;高校檔案信息資源;互聯網技術;集成與服務
基金項目:2018年黑龍江省高等院校檔案研究項目“大數據環境下高校檔案信息資源的集成與服務研究”(項目編號:HGDK2018-14)。
移動互聯網的不斷發展,對人們的日常生活帶來了巨大的便利,大數據時代也便隨之而來。半個世紀以來,整個全球數據總量以每年55%的速度持續增長,如今80%的數據總量則來源于近幾年。數據量增加愈來愈勇,數據規模已經鋪天蓋地,無法使用常規的處理方式進行處理。在大數據時代的來臨之下,各個行業都激起了大數據的巨浪,高校檔案部門也同樣跟隨著大數據時代的腳步。檔案大數據化、大數據檔案信息化等一系列聯想概念也較為廣泛。傳統的信息資源太過局限性、分散性和社會對信息資源的需求便利性、綜合性的沖突逐漸增長,促使信息資源的進行合并的理念,逐步被社會需要。目前檔案信息具有歷史價值的信息資源,其推動了社會經濟的發展,成為了社會發展的主要動力來源。當前的高校檔案信息管理化建設主要內容就是將檔案信息與大數據進行結合,從而為其創建更優秀的資源共享平臺。
1 檔案大數據的含義
1.1 何為大數據
大數據是無法用現有的軟件工具對其進行提取、存儲、共享、分析和處理的海量的、較為復雜的數據合集。檔案大數據是通過設計檔案方面的數據和信息規模大到無法使用現有軟件工具提取和管理的海量數據集合。其特點為數據量大,速度快、多變化等,并且需要可擴展的存儲介質和數據分析,以及數據處理。同時大數據還具有復雜性和不確定性,所以在大數據的背景下,因此對數據資料進行處理和管理有一定的挑戰性。近年來,移動互聯網的不斷發展,各行業為了發展和創新,均將移動互聯網與本身的行業的實際情況相互組合,在組合的過程中,需要長期使用計算機對大量數據菌進行存儲、記錄和處理,其涉及到較多的行業,如軍工、教育、房產、建筑、金融等。
1.2 大數據存儲方式和存儲意義
在進行數據存儲的時候,會采用較為保險的方式進行操作,將信息轉換為簡單的數字檔案方便存儲。該方式具有較高的專業性,需要專業的人員來進行操作。傳統的檔案存儲方式主要是紙質方式存儲,信息技術的進步,改變了現在存儲檔案的介質,如紙質、影像、音頻、圖片等。電子檔案的存儲方式通過采取計算機輔助檔案管理從而變得更加便捷和效率高。數據的處理可以通過計算機進行,檔案的存儲是為了將來需要時,可進行查看和應用。計算機可以處理較為繁雜的數據,獲得的數據量越多,其應用的價值就越大。數據的本身是無價的,借助大數據對公司業務產生幫助才是主要目的。保存檔案可以提供給相關人員查看和應用。如今大數據涌入各種行業,大量的檔案其中涵蓋的是不可估量的價值,其意義在于擁有較高價值的數據施行專業化進行儲存處理。從大量數據中分析用戶行為則是檔案大數據的主要意義,根據用戶行為特點對客戶的需求進行結合,對用戶系統施行針對性的改善,能夠符合用戶習慣,用戶可方便的查閱到自己想看到的信息。
2 大數據環境下檔案信息的整理和保存
結構化的數據可以通過計算機進行處理,而檔案存儲的內容是由大量不夠統一的結構化數據,這些數據以文檔、錄像、聲音、圖片、圖像和各種交叉錯亂的數據予以體現。怎樣能夠及時有效的在大數據的環境下保存這些數據,則是一項較為艱難的工程。把存量大的數據盡量簡化,把內容雜亂的檔案數據重新整理歸檔。 對于檔案大數據的存儲,要先考慮其數據在未來是否會出現大規模的增長,若有此現象發生的可能,則使用大容量的存儲硬盤給予存儲,以確保有較多的數據可以存儲,根據大數據的性質以及特點設計出對應的解決方案,使結構化數據為基本的存儲方式能夠對非結構化的數據進行兼容,可有效對數據進行管理。
3 大數據環境下檔案信息的服務和應用
大數據環境下檔案信息資源方式和傳統利用方式有不同之處,不會以分類存儲和簡單的統計查詢形式出現,可以通過專業的技術手段,從存儲的數據中快速提取重要的信息,并且根據所提取出的有效信息,對相應的需求進行深挖。挖掘出的信息可以滿足不同用戶的需求,才能體現出檔案大數據的精髓。在大數據環境下檔案信息資源的應用和服務為挖掘、智能搜索等方面。
3.1 信息發現
通過文本數據挖掘,可以對數據縮小查找范圍從而提高查找效率。其發現方式是要以大量的數據中進行文本數據挖掘。涵蓋人工智能、數據統計、自然語言處理為主要方式,信息抽取后進行分類、舉例、數據壓縮、數據處理,以信息訪問和知識發現為應用范圍。文本數據發現的主要目的是,將文本在處理過程中所產生的高質量信息進行分類、融合、壓縮,最后在文本抽取中的過程中發現需要的知識和信息。
3.2 智能搜索
智能搜索可以分為語言搜索、音頻、視頻內容搜索、檔案以人工智能輔助借助于語言搜索,采用語音識別,在進行發出命令聲音后, 人工智能通過對人類的聲音和命令中的文字進行系統性分析,最后分析得出其含義,并且予以相應的反饋;進行音頻、視頻內容的搜索,可以直接對計算機輸入視頻或音頻,計算機進行計算分析后可直接對音頻或視頻進行區分,并且在數據庫中搜索出相應的數據。采用智能化輔助分類應用于高校檔案管理,用戶所進行的搜索歷史信息,則會記錄下來并進行分類,通過重復的訓練,可以有效提升智能輔助分類的準確度,同時也可以對用戶的分類表示進行有效的幫助。
4 總結
高校檔案信息管理施行大數據管理是必然的趨勢,通過對其管理方式的改變可有效提高檔案管理的效率。所有的教育單位機構都將要面對大數據時代所帶來的大量多元化數據資料,高校檔案管理部門這種信息量巨大并且較為集中的數據管理機構,必須要對數據的收集、利用等工作進行加強。檔案管理部門,要根據大數據時代檔案管理模式的發展需要,從而積極與信息化統計部門進行密切合作,制定多種有效的數據的管理體系,將各行業產生的數據進行規范整理,根據數據的類型進行分類,建立數據搜索機制,將高校檔案管理在大數據時代環境下打好基礎。
參考文獻
[1]吳娜.大數據背景下檔案信息資源整合策略探析[J].開封教育學院學報,2018,38(12):241-242.
[2]楊來青.大數據背景下檔案信息資源挖掘策略與方法研究[J].中國檔案,2018,538(08):55-56.
[3]顏英利.大數據背景下高校教學資源整合研究[J].中國成人教育,2018,457(24):39-41.
[4]劉丹.大數據時代高校數字教學資源整合對策研究[J].數字通信世界,2019,171(03):256.
[5]司國斌,叢金梅.大數據時代高校教學模式的改革研究[J].成才之路,2017,(16):18-18.
作者簡介
吳衛(1971-),女,漢族,黑龍江省克東縣,黑龍江省黑河學院,本科,研究館員,研究方向:檔案管理。