潘明哲
( 黑龍江省自然資源權益調查監測院,黑龍江 哈爾濱150000)
森林資源, 從廣義講是指林木、 竹類和林區范圍內其他植物、動物、微生物、林地資源和環境資源的總稱,從狹義講是指以喬木為主體的森林植物組成部分。 森林資源經營是為取得森林多種效益,通過計劃、組織、指揮、協調和控制,對一地域內的森林資源及相關因素進行籌劃和控制的過程。 森林資源分布的地域性以及資源本身所具有的空間屬性決定了森林資源信息必須應用數據挖掘技術,才能更合理、直觀、及時和動態地監測和預測森林資源的動態變化,取得更好的經營效果和效益。
在當前的大數據時代下, 數據挖掘技術在各個行業范圍內都起到了重要作用。 該技術結合了現代尖端的人工智能、 數據分析、數據庫以及信息識別系統等多種技術手段,滿足市場變化范圍的各個領域的基本需求。 在當前的發展情況下, 這種大數據模式對于數據發掘來說,不僅是一個快速發展的機會,也是一個挑戰。 在這種背景下,數據挖掘技術也在不斷的摸索,調整技術的運轉體系,對數據進行更準確的分析,提高其準確性與處理效率,不斷地進行優化,使其應用的領域更加廣泛。
在一般情況下的數據挖掘分析當中, 大致分為以下八個步驟: 第一步信息收集,在初步確定數據分析對象后,對其中的具體數據內容信息進行選定,再選擇適當的收集方式,將數據進行篩選儲存,將其準確的輸入的數據庫當中。 第二步數據集成,將不同類型、格式的數據進行分類數據化處理,在分析時,能夠為其提供數據共享的便利條件。 第三步數據規約, 這一步的目的實際上是提高數據的處理時間, 提高效率與準確率。 通過技術的內部運轉,進行數據規約處理,在保證原數據的準確性與完整性的同時,精確了數據挖掘的結果。 第四步數據清理,在數據的收集輸入當中,也會存在一些數據不準確、部分缺失的問題,為了保證數據挖掘技術的準確性,對于這部分數據應進行數據清理,將準確、完整、統一的數據錄入其中。 第五步數據變換,準確來說是對數據的形式進行變化,統一其形式,為數據發掘分析提供便利。 第六步數據挖掘的過程,根據數據庫中的信息,應用適當的處理工具與方法,挖掘出重要的信息。第七步模式評估,對于數據挖掘的結果,有第三方專業人員介入進行驗證評估。 第八步知識表示,將數據挖掘評估后的結果,轉化為用戶可視化的信息模式,供其參考應用。 數據挖掘的過程是比較漫長的,且環節步驟比較多,我們需要嚴格把控各個環節,保證數據挖掘結果的準確性。
隨著數據挖掘技術不斷優化、內容的不斷豐富,所適用范圍也越來越廣泛,涉及到的數據信息內容不僅量大,種類也比較多。 隨著科技水平的不斷發展與提升,數據挖掘系統中分類、識別、預測、基礎預測等功能都有所提升,挖掘的對象內容也在不斷的擴大。 在大數據與互聯網+ 的大時代背景下,數據挖掘技術從這個角度上也順應了時代的發展,再加上未來信息通信技術的結合,數據挖掘技術的發展是非常客觀的。
神經網絡通常是與數學模型共同結合, 執行功能計算處理的,該挖掘方法是在十九世紀五十年代由國外的物理學家與數學學家共同創建的。 這種數據挖掘方法自身的兼容性、適用性、組織能力以及數據處理等性能都比較好,可以識別、預測的數據類型也比較多。 通過網絡神經單元的處理,進行了非線性的新型計算處理,大幅度提升了數據的挖掘速率。 但是該方法也存在缺點,就是對于用戶來說,這種神經網絡比較空洞,對于挖掘的過程相對茫然。
隨著科技水平的不斷發展,決策樹法也逐漸在更新優化,推出了不同類型的算法,例如:ID3、C4.5。 該方法適用于預測類的數據計算,能夠將數據進行有效的分類,并從中快速獲取有價值的信息,進行數據分類與基本描述,在數據挖掘當中,更適合規模較大的數據處理。 并且分類算法之間的關聯性比較強,在此基礎上,數據處理的限制屬性也比較弱,挖掘的結果也便于用戶的理解。
貝葉斯分類法是一種算法簡單且精準度較高的分類算法,當前可以分樸素貝葉斯算法與動態貝葉斯算法等。 從分類的功能上來看,該方法與決策樹和神經網絡法之間,有著緊密的聯系。 與其它方法不同的是,該方法不是獨立存在的,通常以模塊處理器組合的方式呈現出來。 在精準度與數據處理上,都優于其它方法,并且對于數據的處理更加全面,能夠通過信息處理、自動控制和識別系統來進行多范疇的共同運作,更能體現挖掘技術的基本性質。
森林資源經營中,最重要的就是森林資源的質量,這就需要對森林資源進行實時監測,了解其基本情況,這樣對森林的成長狀態和森林資源的經營狀況也能有所了解。 森林資源范圍比較廣,在監測上工作難度比較大,且需要調查統計的數據也比較多,傳統的數據調查模式,不僅費時費力,信息的準確程度也相對較低。 但應用數據挖掘技術, 可以更好的實現對數據的統計, 并且通過決策樹或是神經網絡的方法不僅調查起來耗時短、準確率高,數據的結果也更加清晰,為監測工作提供了便利。
林木的生長在一般情況下,都是呈周期性規則變化的,通過數據挖掘技術可以將林木的生長情況進行系統的數據分析,以數據的形式對林木未來的成長趨勢進行預測,并針對其未來的成長趨勢做出相應的培養方案,促使林木的生長更加健康。 并通過貝葉斯分類法,將林木的狀況進行基本的分類,以此來實現森林資源經營效益。
相應促進森林資源的健康發展, 就要了解林木容易出現的問題,并對此做出相應的措施防護。 其中包括:森林的防火和防蟲害工作,森林火災是一種常見的自然災害,發生的頻率比較高,且一般呈現蔓延的趨勢,人們大多時候不能及時的發現。 但是通過數據發掘技術,可以通過計算機對比數據的變化,并且在出現火災情況后,也會及時預警。 而防蟲害則是通過對比林木的健康數據實現的,通過數據挖掘技術的及時反應,能夠對其做出及時的防護,避免造成更大的經濟損失,增強森林資源的經營效益。
我國大部分森林資源的范圍都比較廣闊, 且資源內容較為豐富,傳統的數據統計不能滿足當前的經營需求,呈現出一種盲視感。 通過數據挖掘技術的實踐證明,對于數據的統計,該技術手段的優勢更大,結合GIS 和GPS 的雙定位技術,數據信息的特征會更加明顯,數據的規律性也更強,增強了森林資源的可視化,進一步擴大了森林資源的經營優勢。
總而言之,面對復雜的森林資源狀況,數據挖掘技術的應用必不可少,想要該技術得到更全面的應用,相關人員也該對技術的流程、內容、系統以及處理模式進一步分析,為森林資源的經營提供更有價值的技術支持。