吳海波,趙曉慎?,王治國,張超
(1.華北水利水電學院,450011,鄭州;2.水利部水利水電規劃設計總院,100011,北京)
水土保持區劃是水土保持規劃的基礎工作和關鍵技術環節。為了使水土資源得以充分利用,水土流失得到有效控制,水土資源在經濟、社會和生態的效益達到最大化,為科學開展水土保持工作提供決策依據,對水土保持區劃的研究具有十分重要的現實意義。近些年,隨著社會經濟發展與生產實踐需求,水土保持區劃以辛樹幟等[1]于1982 年提出土壤侵蝕類型對中國水土流失進行分區后,經過調整和補充,為其他全國水土保持區劃研究提供基礎理論[2-3]。王治國等[4-5]根據我國水土保持區劃存在的實際問題,提供解決辦法和提出水土保持區劃基本框架理論;魏曉等[6]依據寧夏地域差異類型及防治措施進行了水土保持區劃。以土壤侵蝕類型、地域差異類型等進行區劃指導水土保持工作,取得了較好的實際應用效果,但存在方法指標單一、主觀定性偏重等不足。隨著現代數理統計分析理論和計算機技術的快速發展,引入了主成分分析法、聚類分析法、遙感技術等方法和技術[7]。筆者采用多元統計知識的Bayes 判別分析理論建立水土保持區劃綜合判別模型,以定性指標選擇與定量數據計算相結合,用主成分分析法對指標進行選擇,對已有觀測樣本的若干數量特征對新樣本進行識別,判別新樣本所屬類型,并將該方法應用于甘肅、寧夏、青海3 省份的黃土丘陵溝壑區進行區劃分析。
甘肅、寧夏、青海(甘寧青)3 省份的黃土丘陵溝壑區屬于我國第二級地形階梯中西北黃土高原區的一個二級區。該區位于日月山以東,大阪山、烏鞘嶺至白于山一線以南,六盤山以西,秦嶺以北的西北黃土高原,主要位于黃河流域范圍內,面積為12 萬6 087.8 km2,涉及甘肅、青海及寧夏3 省份共50 個縣(市、區)。區內地面坡度較緩,以丘陵為主,有部分高地草原區和小盆地,其中山地占52.21%、平原占22.54%、其他占25.25%。因該區地處西北內陸,氣候條件干旱少雨,年均降雨量約為386 mm,干旱指數約為1.1,年均氣溫約為4.5℃,是一個氣候比較敏感的生態脆弱地帶[8]。甘寧青地區位于黃土高原、內蒙古高原和青藏高原交匯處,是一個地緣遼闊的少數民族積聚地,經濟條件落后,生產水平低下,由于特殊地形、地質和氣象條件,加上當地百姓毀林開墾及過度放牧,植被破壞嚴重,林草覆蓋率約為38.45%,土壤侵蝕非常嚴重,加大了水土流失發生的頻率、災害的程度及治理的難度[9]。
Bayes 判別分析模型是根據已有的樣本建立判別函數對測試樣本進行識別,判定測試樣本所屬類別的一種方法。其基本思想是充分利用各類先驗信息,考慮已有樣本先驗概率,利用Bayes 公式按照一定準則構造判別函數,以測試樣本在各判別函數中所得最大值的一類為測試樣本所屬類別[10]。


式中:μi為第i 個總體的均值;Σi為第i 個總體的方差。
對于一個新樣本x 到其中任意2 個總體Gm和Gn的馬氏距離的平方差[12],具體形式為

gm和gn分別為2 個總體Gm和Gn的概率密度函數,具體形式為:

式中:μm,μn為2 個總體的均值向量;Σm,Σn為2 個向量的協方差矩陣。
當Σm=Σn=Σ 時,根據式(2)、式(3)和式(4)可得Bayes 判別函數,具體形式為

當存在Σ1=Σ2=…=Σg=Σ 時,則得到多正態總體的Bayes 判別函數

式中qi為總體Gi的先驗概率。
通過Wi(x)可得x 屬于Gi的后驗概率P(Gi/x),具體形式為

由式(7)可知,后驗概率P(Gi/x)與概率密度exp(Wi(x))成正比關系,則對于給定的樣本x∈Gi,Bayes 判別準則表示為

本文對Bayes 判別分析算法的實現進行編程計算,其結構流程如圖1 所示。

圖1 Bayes 判別分析算法流程Fig.1 Flow chart of bayes discriminant analysis
為了對甘寧青黃土丘陵溝壑地區進行更加合理的區劃,更好地規劃并利用水土資源服務于當地社會生產和生活,使得區域間相似性最小,區域內差異性最小。根據以地形地貌、土壤侵蝕等內部因素為主[13-14]進行區劃的結果,甘寧青黃土丘陵溝壑地區由隴中高原區、甘肅中部黃土丘陵溝壑區及黃土高原西緣區等3 部分組成,分別記為G1、G2和G3。文中考慮該地區自然資源條件、社會經濟情況和水土資源流失等外部特征,選取每個研究單元的綜合農業生產、土地生產力、水文氣象及土壤侵蝕等方面為研究內容,對土地總面積、耕地面積、林地面積、草地面積、人口總數、糧食總產量、降雨量和蒸發量等10 個影響因素進行數據分析和整理,采用主成分分析法對影響指標進行處理,得到墾殖率x1、林草覆蓋率x2、人口密度x3/(人/km2)、單位面積糧食產量x4/(kg/hm2)、降雨量x5/mm 和蒸發量x6/mm 等6 個主要影響指標作為Bayes 判別分析算法因子,根據式(6)建立區劃分類判別的Bayes 判別分析函數,對甘寧青黃土丘陵溝壑地區進行區劃分析。
以甘寧青黃土丘陵溝壑區中的50 個縣(市、區)作為研究對象,其中隴中高原區G1有23 個,甘肅中部黃土丘陵溝壑區G2有10 個,黃土高原西緣區G3有17 個。為了對甘寧青黃土丘陵溝壑地區進行準確的劃分,檢驗土壤侵蝕類型區劃的合理性。將處于3 個區域邊界上的10 個縣(市、區)提取用作Bayes 判別分析的測試樣本,其數據見表1。

表1 待判別的縣(市、區)Tab.1 Undiscriminanted county(city,area)
對剩余40 個縣(市、區)的各因子數據進行分析,可得G1、G2、G3的樣本容量分別為n1=18,n2=8,n3=14,且其相應的先驗概率分別為q1=9/20,q2=1/5,q3=7/20。利用Bayes 判別分析理論建立區劃Bayes 判別函數,根據式(6)計算,得到甘寧青黃土丘陵溝壑地區的區劃數學模型,見式(9)~(11)。



將表1 中待測數據代入式(9) ~(11),計算Bayes 判別函數Wi(x)(i=1,2,3),結果見表2。

表2 Bayes 判別分析測試結果Tab.2 Test results of discriminant analysis by Bayes
利用式(8)對表2 中判別數據Wi(x)(i=1,2,3)進行判別分析,與測試樣本在土壤侵蝕類型下所進行的區劃結果進行比較,Bayes 判別分析區劃模型判斷正確率為100%。Bayes 判別分析區劃模型論證了甘寧青黃土丘陵溝壑區劃按照土壤侵蝕類型進行水土保持區劃的合理性,同時也說明對水土保持區劃存在著多種方法。甘寧青黃土丘陵溝壑區建立的Bayes 判別分析區劃模型結果與實際情況吻合,其準確率大于80%,可推廣至其他地區進行水土保持區劃[10]。
通過Bayes 判別分析理論對甘寧青黃土丘陵溝壑區進行區劃分析,采用墾殖率、林草覆蓋率、人口密度、單位面積糧食產量、降雨量、和蒸發量作為判別因子,提出了Bayes 判別分析甘寧青黃土丘陵溝壑地區的區劃數學模型。實例結果表明,該模型具有操作簡單易懂、計算速度快及準確率高等特點,與按土壤侵蝕類型進行區劃的結果一致,正確率為100%。說明Bayes 判別分析是一種判別效果較好的數學區劃判別技術,可以應用于水土保持區劃中。
[1] 辛樹幟,蔣德麟.中國水土保持概論[M].北京:中國農業出版社,1982:35-42
[2] 關君蔚.水土保持原理[M].北京:中國農業出版社,1995:130-133
[3] 水利部.SL 190—1996 土壤侵蝕分類分級標準[S].北京:中國水利水電出版社,2007
[4] 王治國,王春紅.對我國水土保持區劃與規劃中若干問題的認識[J].中國水土保持科學,2007,5(1):105-109
[5] 張超,王治國,王秀茹,等.我國水土保持區劃的回顧與思考[J].中國水土保持科學,2008,6(4):100-104
[6] 魏曉,孫峰華.寧夏水土保持及區劃研究[J].水土保持研究,2005,12(6):119-121
[7] 尹輝.澧水流域水土保持區劃與綜合治理模式配置[D].長沙:湖南師范大學,2009
[8] 劉春艷,白永平.甘寧青段黃河經濟帶發展研究[J].地域研究與開發,2005,24(1):62-65
[9] 黃正林.近代甘寧青農村市場研究[J].近代史研究,2004(4):123-156
[10]鄭國強,張洪江,劉濤,等.基于Bayes 判別分析法的密云縣山洪泥石流預報模型[J].水土保持通報,2009,29(1):83-87
[11]宮鳳強,李夕兵.隧洞圍巖穩定性評價的Bayes 判別分析法及應用[J].地下空間與工程學報,2007,3(6):1138-1141
[12]王學民.應用多元分析[M].上海:上海財經大學出版社,2009
[13]水利部,中國科學院,中國工程院.中國水土流失防治與生態安全:西北黃土高原區卷[M].北京:科學出版社,2010:26-39
[14]唐克麗,熊貴樞,梁季陽,等.黃河流域的侵蝕與徑流泥沙變化[M].北京:中國科學技術出版社,1993