(成都理工大學管理科學學院 四川 成都 610059)
自然環境是人類社會活動的基本載體,其中與地質環境的關系尤為密切。雖然很多學者都提出了地質環境承載力的概念、研究對象和研究內容,但是能夠很好地將區域環境系統和區域社會經濟活動的方向、規模相結合的環境承載力理論體系的研究還很少見到報道。大數據技術的發展,一方面促進了數據采集技術的更新,另一方面也促使著地質環境承載力方法的進步,尤其是人工智能技術應用,徹底改變了傳統的評價方法。本文引入機器學習方法,以地質環境承載力的評價理論為基礎,提出了基于機器學習算法的地質環境承載力評價方法。通過梳理國內外地質環境評價相關成果,分析地質環境的各種評價要素,提煉出影響地質環境承載力的主控因素,在此基礎上建立適合于機器學習的地質環境承載力評價指標體系,再結合機器學習方法,構建基于機器學習算法的地質環境承載力評價模型,對區域地質環境承載力進行評價,為其他區域的地質環境承載力評價提供應用示范和評價方法。
機器學習是一門多領域交叉學科,涉及數學、統計學、計算機等相關知識,機器學習算法包含的算法比較多,例如深度學習算法,人工智能算法,回歸算法,決策樹算法,貝葉斯算法,聚類算法等都屬于機器學習算法。針對地質環境承載力評價,采用決策樹算法來進行地質環境承載力評價,決策樹算法是屬于有監督學習的分類,通過將不同數據源匯集到一起,建立相關的數據池,對已知分類的數據進行機器學習,訓練出相關模型。通過研究地質環境承載力評價和機器學習的相關文獻,提煉相關評價方法;多渠道(包括野外)收集地質環境等相關資料,系統整理地質環境評價信息,在此基礎上分析影響地質環境的主控因素,并進行指標分級,構建地質環境承載力綜合評價指標體系;抽取相關地質環境歷史數據,進行機器學習,生成地質環境承載力評價的規則庫,構建地質環境承載力評價的機器學習模型,再通過模型對評價數據進行評價,得到評價結果。
ID3算法的生成模型根據導入的樣本數據,按照80%的樣本比例作為訓練集,依據ID3決策樹算法原理,根據訓練集生成ID3決策樹的具體流程如下:(1)首選選擇系統熵(經驗熵)最大的屬性作為最優屬性進行分裂,創建根節點,為分支節點分配相應類別,遍歷訓練集一次;(2)如果訓練集均屬于同一類別或者訓練集中只剩下一個樣本,返回子節點,并將其作為葉節點,同時判定相應類別;(3)對訓練集循環執行每個屬性劃分,計算該屬性劃分的信息熵,比較各個屬性的信息熵,選擇信息熵最大的屬性作為分支節點進行分裂,同時訓練集分裂為兩個子集;(4)對訓練集劃分的子集反復執行步驟(1)-(3),直到信息熵為0,所有分支節點為一類時,標為葉節點,輸出分類結果。
根據以上流程,生成的ID3算法模型如下:

根據構建的地質環境承載能力綜合評價體系為理論基礎,基于收集的樂山市地質環境方面的資料數據,對樂山市劃分出的34個自然單元的地質環境承載能力,采用決策樹方法進行了評價,得到了34個自然單元地質環境承載能力的綜合值,并依據評價綜合值將區域內的承載能力分為承載能力高(I)、承載能力中(II)和承載能力低(III)等三類。
根據樂山市地質環境承載能力綜合評價結果,可得到如下結論:綜合分析眉山市國土的空間特征、資源特征、環境特征,以及地質環境承載能力評價,眉山市區位優勢明顯,人口集聚程度高,適宜開發的資源相對豐富,是四川經濟發展條件較好的區域,總體適宜優化開發。地質環境承載能力方面,高中山區為高海拔生態脆弱區,為崩滑流地質災害高易發區,主要位于眉山市西部。地質環境承載能力大的區域位于中部和東部區域,地質環境承載能力較大的區域位于中部及中北部,總體地質環境承載能力高。