葉海斌 陳增琦 王正猛 郭松杰 羅劍
摘要:在時代不斷向前發展的今天,大數據已經成為影響到國家社會發展的重要資源,做好海洋的相關檔案管理工作,是我們在戰略高度上了解海洋、探索海洋,挖掘海洋資源、保護海洋的關鍵,而海洋檔案的數據挖掘工作又是海洋檔案管理的重中之重。所以在互聯網高度發展的今天,將大數據分析挖掘技術應用于海洋檔案的數據挖掘是非常有必要的。本文將從海洋檔案數據挖掘工作的現狀入手,對其概念、存在問題以及在海洋檔案管理中的具體表現應用等進行詳細分析,希望通過本文的研究,能夠在做大程度上發揮出數據資料對于海洋管理工作的重要意義,給我國的海洋檔案管理工作一點啟示。
關鍵詞:大數據;海洋檔案管理;數據挖掘
海洋檔案通俗來說就是國家的海洋海事管理機構、從事海洋研究的社會團體以及個人在從事海洋管理工作中的海洋資源開發、海洋資源的收集整理、海洋事業中的公益性服務、海洋資源的相關科學研究等等活動時,留下的工作記錄以及數據資料。這些海洋檔案對于我們從事海洋工作,做好海洋資源的合理開發利用以及繼承和發展海洋事業有著非常重要的作用,是我們需要不斷挖掘和繼承的藍色基因。
1、海洋檔案數據挖掘存在的問題
在海洋檔案管理工作中引入大數據分析的相關概念,還處于開始發展的階段,相關的制度概念還存在很多方面的問題。
1.1與數字化的混淆
檔案的數字化管理,其實就是在互聯網剛普及的時候將紙質版的檔案資料錄入到網絡系統中,想要找需要的資料時,在從錄入的信息庫中查找即可。但數據化則是在數字化的基礎上建立起的新的概念,是將有用的信息數據有邏輯地重新組合排列,同時借助互聯網技術使錄入信息數據能夠自動的被分析計算,比數字化更加復雜,更加智能。但目前由于我國對于海洋檔案管理的數字化建設已經十分成熟,但數據化建設才剛起步,概念的不完善讓很多研究人員管理人員經常會將海洋檔案數據挖掘同數字化建設混淆在一起,給我國的海洋檔案數據挖掘技術的發展造成了巨大影響。
1.2電子文件不規范
由于海洋的相關檔案資料與其他領域的檔案不同,海洋檔案相比起來更加復雜,而且海洋檔案的數據與數據之間相互交叉,形式多樣,整理起來更加難以統一。再加上關于海洋檔案的管理和研究還處于發展階段,相關工作人員整理檔案的專業素養和能力還有待提高。種種原因都造成目前建立起的數據檔案和電子文件都沒有統一規范的格式,給后期的數據查找和數據分析帶來很大的困難。
1.3技術規范和規章制度不完善
一方面因為海洋事業本身具有特殊性,設計的學科范圍更廣,信息更加多且復雜,為我國的海洋檔案數據挖掘技術的規范化管理增加了難度。另一方面,也有目前關于在海洋數據挖掘方面的重視程度不夠,很多規章制度還處于需要在實踐中不斷探索完善的階段,這在一定程度上也給海洋檔案的數據挖掘造成了一定困難。
2、海洋檔案數據挖掘的具體應用
依賴互聯網技術,對海洋信息數據進行深層次的分析處理和二次挖掘,已經成為我們了解海洋、利用海洋的重要手段和新型途徑,所以對于海洋檔案數據挖掘技術的應用可以從以下幾個方面進行。
2.1應用于海洋檔案的分類整理
想要在紛雜多樣的數據中挖掘出需要的有價值的信息,就必須將海洋檔案的分類整理作為數據挖掘的第一步,將海洋檔案按照科學有序地順序進行分類。這樣的基于數據挖掘的數據分類管理,一方面有利于提高數據分類的效率,縮短分類時間,見更過的精力用于后面的數據分析上面。另一方面,也可以幫助海洋檔案管理人員提高服務水平,節省了管理人員的時間和精力。想要真正將數據挖掘應用與海洋檔案的分類整理工作中,需要我們利用大數據分析技術,將經常查閱資料的人員需求收集起來,通過既定算法分析,按照算法算出的規則需求進行數據資料的分類整理。這樣整理出的數據庫更加符合需求,管理人員查找時也更加方便快捷。同時也可以將大數據分析加入到整理后的數據庫中,使查閱者在查閱資料的同時還可以接收到大數據推薦的相關海洋資料。
2.2應用于海洋檔案的數據收集方面
將海洋檔案數據挖掘應用于數據收集,簡單來說就是將大數據分析技術與數據挖掘概念結合起來,在數據收集的過程中建立起智能的數據分析模型,更高效地收集到有用信息。這樣數據模型的建立,使信息收集更加全面,收集到的數據和信息更加準確,也在一定程度上減輕了數據收集人員的工作壓力。也只有在前期數據收集的過程中實現有效分析,才能夠避免在后期工作中增加書記篩選的工作量。所以,可以通過海洋檔案的數據挖掘技術,在收集數據的過程中運用大數據分析算法,將與之相關的其他隱藏信息也收集整理出來,同時形成穩定的智能收集模型,自動地有選擇性地隨時收集信息,使收集的信息更加準確有效。同時這樣的數據收集模型也可以保證所收集數據的準確性,為后面的海洋數據分析過程打下堅實基礎。
2.3應用于海洋數據的分析歸納
海洋數據本身就是一個多學科交叉的復雜信息系統,再加上互聯網時代的信息來源更加復雜多樣。這就導致海洋信息數據在一定程度上來說并不是一個個獨立的個體,而是相互聯系的信息網絡。這樣的情況也給從事與海洋數據分析以及檔案管理的工作人員帶來了較大的分析難度。所以就需要通過依靠檔案數據挖掘技術的應用,將大數據分析與海洋數據的分析結合起來,通過科學的算法建立起一個科學的數據處理模型。這樣的方式可以幫助我們及時地將收集整理好的海洋數據分析出其背后的價值,充分挖掘出信息背后隱藏的相關信息和資源,真正地發揮出海洋檔案的最大價值,充分利用好大自然賦予我們的藍色資源,在這個信息化時代享受到信息數據帶來的巨大資源。
結語
在互聯網時代,可以說掌握了互聯網,就掌握了時代主動權。對于海洋檔案管理工作,我國已經建立起完善的數字化系統的設備,為了將海洋信息和海洋數據做大程度地挖掘出來,發揮數據的最大潛力,就必須將大數據分析技術與海洋檔案數據挖掘技術結合在一起進行分析研究。為此,本文對海洋數據挖掘過程中存在的問題進行分析,并提出將大數據和海洋檔案數據挖掘聯合應用,希望能夠給海洋檔案管理工作提供一點思路。
參考文獻
[1]吳曉文,孫杰,楊帆.大數據背景下海洋檔案數據挖掘研究[J].辦公室業務,2017,000(019):186-187.