陳穎異,孫藝寧,許嘉巍,王 丹
(東北師范大學地理科學學院,吉林 長春130024)
數量分類學是由美國生物統計學家索卡爾和英國微生物學家斯尼思等在20世紀50年代末所創建;60年代后,逐漸被越來越多的生物學家所接受,并將其廣泛應用于生物分類當中[1]。植被的數量分類是數量分類學在植物學中的重要應用,主要是以植物物種的組成以及各種數量指標為基礎,利用相應的數學方法來對物種進行定量的分類研究[2]。森林是植被的主要類型之一,其基本的分類單位是林型。林型是按照群落的內部特性、外部特征及其動態規律所劃分的同質森林地段。劃分森林類型的目的是為森林調查、造林、經營和規劃設計提供科學依據,對不同的類型采取不同的營林措施[3]。
關于長白山地區的植被分類研究,起始于20世紀90年代,錢宏[4]采用等級分化分類法和DCA排序法,對長白山高海拔地區的凍原植物進行了分類比較研究;翟永華和劉海棠[5]運用PC-VTAB程序中植被排表分析法,得出植物鑒別概要表,并為各個等級的植被類群篩選出診斷種,提高了分類質量;徐文鐸等[6]根據對長白山植被調查和長期定位觀測資料,總結了長白山植被類型特征和演替規律;王穎[7]利用2000—2007年的遙感數據,建立NDVI-LST的特征空間模型,對長白山地區進行了植被分類和植被變化特征分析研究。
目前,關于林型分類的研究較為缺乏,將數量分析方法運用到林型分類中,既避免了傳統人為分類的主觀臆斷性,同時彌補了遙感技術分類粗略的缺點。本文通過選取、測量具有一定生態學意義的林型指標,并對其數據進行主成分分析,計算得出長白山科學院實驗基地4種林型綜合分類指標的數值范圍,使得分類工作者在野外進行一定的試驗和數據處理后,通過對照分析林型綜合分類指標的數值范圍,進而快速有效地對林型進行分類。以此實現對長白山區森林群落系統的準確識別,從而更好地保護長白山珍貴物種的種質資源,使得林區更加持續穩定發展。
長白山科學院實驗基地,位于吉林省長白山自然保護區內(圖1),地理位置為北緯42°21′28.618″~42°25′7.854″,東經 127°59′17.291″~128°4′37.969″,海拔 650~900 m,總面積 2 088 hm2。地處山地針闊混交林氣候帶,氣候特點是冬季寒冷干燥,夏季溫暖濕潤。年均氣溫在2.51℃左右,其中最冷的月份(1月)平均氣溫為-17.5℃,最熱月份(7月)平均溫度為19℃,年均降水量為680 mm,年均風速較小。實驗基地坡面較緩、地形差異不大,土壤以白漿土為主。基地內分布有3條主要河流,所有河流最后在二道江匯集,是松花江的水源之一。

圖1 長白山科學院實驗基地位置
實驗基地內植被主要是以雜木林和紅松闊葉林為主,樹種資源豐富,紅松(Pinus korainensis)、長白落葉松 (Larix Olgensis) 及紫椴(Tilia amurensis)為主要成林樹種,并與其他針闊葉樹種,如白樺(Betula playtyphylla)、楊樹(Populus tomentosa)等形成針闊混交林。研究區內原始林較穩定,生境條件好,基地中的絕大部分都是天然林,只有很少一部分是人工林。天然林主要林型為雜木林、白樺林、長白落葉松林、紅松闊葉林以及混交林;而人工林則只有果樹林。較大面積的次生林主要分布在林區公路沿線,主要樹種包括白樺次生林及蒙古櫟次生林。
本研究根據長白山科學院實驗基地的林斑調查數據,選取基地內未受過人為砍伐、耕種等干擾,仍保持原始狀態的4種天然林型:雜木林、白樺林、紅松闊葉林和長白落葉松林進行樣方調查。在每種林型內隨機設置20個20 m×30 m的樣地,共80塊樣地,編號1~60為建立林型數量分類方法研究的樣地,編號61~80為驗證林型數量分類方法可行性的樣地。
所選取的分類指標需要具有快速測量得到試驗結果的易獲得性,以及能充分體現植被群落和環境特點的綜合性。結合以上2點選取原則,從植物群落的數量特征、氣候數據、土壤數據3個方面共選取了9個分類指標,分別為:葉面積指數LAI、有效光合輻射、土壤呼吸通量、土壤pH值、速效氮、速效磷以及土壤溫度、濕度、鹽度。
測定時間選在天氣狀況較好的生長季,使用LAI-2000冠層儀測量實驗當天的太陽輻射值和不同植物的葉面積指數,使用LI-8100土壤碳通量測量系統測量土壤呼吸通量。在不同樣地上按照土壤發生層,采用對角線法進行取樣。在對角線的位置,利用土壤三參數分析儀對土壤溫度、濕度以及鹽度、空氣濕度進行測量,并在同一位置使用土壤酸度計測量土壤的pH值。將采集的土壤樣本進行混合,使用土壤速測箱,對土壤的速效氮、速效磷進行測量。
主成分分析 (principal component analysis,PCA)是一種重要的多元統計分析方法,也被稱為主分量分析或矩陣數據分析[8]。它主要是通過對變量進行正交變換處理,把原來的多個指標變量轉換為若干個綜合指標變量,從而對多維變量系統進行降維處理,使得問題得以簡化。主成分分析提取出的較少的綜合指標之間互不相關,卻能提供原有指標的絕大部分信息;因此,在保證研究精確度的前提下提高了研究效率[9]。
選取Z分數的方法對原始數據進行標準化處理,以消除不同量綱之間所造成的差異性。在此基礎上,對樣地編號1~60的試驗數據進行主成分分析,獲取分類指標之間的相關關系,提取主成分因子,并計算得出不同林型綜合分類指標的數值范圍;最后將樣地編號61~80的試驗數據,代入到林型綜合分類指標的計算公式,進行林型數量分類方法可行性的驗證。上述數據處理與統計分析均使用SPSS22.0統計軟件完成。
運用SPSS22.0軟件對數據進行運算處理,得到相關系數矩陣,即原始分類指標之間的相關性(表1)。由表1可以看出,多數分類指標間的相關系數達到顯著水平,如葉面積指數與土壤溫度呈現極顯著的負相關關系(r=-0.801)、與土壤鹽度呈現極顯著的正相關關系(r=0.894);土壤呼吸通量與土壤pH值呈現極顯著的負相關關系(r=-0.882);土壤濕度與速效氮和速效磷呈現極顯著的正相關關系(r=0.938、r=0.959)等。所得出的相關系數矩陣中絕對值大于0.3的系數(P<0.01)占66.67%,表明各變量間大多為強相關,故認為適合進行主成分分析。

表1 分類指標的相關系數矩陣
利用軟件對數據進行主成分分析,提取出3個主成分因子,各主成分因子的特征值與貢獻率見表2。一般選取特征值大于1且累計方差貢獻率大于85%的作為主成分因子,前3個主成分的初始方差貢獻率分別為42.568%,37.667%和15.648%,累積方差貢獻率達95.883%,說明這3個主成分已經涵蓋了原指標絕大部分的信息,剩余其他因子的信息載荷可以忽略不計。因此,降低了原始數據的復雜性,達到了降維的目的。

表2 各主成分的特征值和方差貢獻率
由軟件的輸出結果得到各主成分因子的載荷值(表3),即表征指標變量與各主成分間的相關系數,其絕對值的大小決定歸入的主成分因子,指標變量的絕對值越大即對該主成分的影響越大。由表3中可以看出,主成分一(F1)所包含的因子最多,其中光合有效輻射、速效氮、速效磷、土壤濕度為F1的主要影響因子;主成分二(F2)中以葉面積指數、土壤溫度、土壤鹽度為主要影響因子;主成分三(F3)中則以土壤呼吸通量與pH值為主要的影響因子。

表3 各主成分因子載荷值
將各主成分因子的載荷值(表3)除以相應主成分特征值的平方根,即得出不同主成分的特征向量,作為計算各樣本點主成分值的權重,再結合標準化數據,由公式(1)計算出每個樣本點的3個主成分值;其在由3個主成分向量組成的三維空間里顯示,結果如圖2所示,可以看出每種林型的樣本點都發生了明顯的匯聚現象,不同林型的類型區域劃分顯著,達到了有效分類的目的。

式中,Fij為第 i個樣本點的第 j個主成分值;pij為 第i個樣本點第j個評價因子的標準值;nj為第j個主成分的特征向量。
根據由軟件得出的各主成分的方差貢獻率(表2),將其作為計算不同林型綜合主成分值的權重,再由公式(2)計算出不同林型樣本點的綜合主成分值,即可得出4種林型綜合分類指標的數值范圍,計算結果見表4和圖3。

圖2 林型分類主成分分析散點圖

式中,Fi為第i個樣本點的綜合主成分值;Fij為第i個樣本點第j個主成分值;wj為第j個主成分的方差貢獻率。

表4 不同林型綜合分類指標的數值范圍

圖3 不同林型綜合分類指標數值范圍的數軸圖
為驗證林型數量分類方法的可行性,從雜木林、白樺林、紅松闊葉林和長白落葉松林4種林型中各選取5個樣地,共計20個樣地進行林型分類驗證試驗。對每個樣地進行指標測量和數據標準化處理,然后將數據代入到綜合主成分值的公式中,計算出不同林型樣本點的綜合主成分值,再與對應林型綜合分類指標的數值范圍進行對比驗證。20個驗證樣地中,有18個樣地利用林型綜合分類指標而成功確定林型,準確度達90%。將驗證樣地的各主成分得分值繪制在包含已劃分林型區域的三維空間里,按照林型類別用對應顏色的菱形標示,結果如圖4所示,可以清楚地看到大部分數據點落在對應的林型區域內,由此說明使用這種方法可以很好地對林型進行分類判別。

圖4 林型分類主成分分析驗證散點圖
(1)通過對長白山科學院實驗基地4種林型的9種分類指標數據的分析表明,運用主成分分析法能夠很好地消除林型分類時不同指標之間所反映的重復信息,對多維指標變量系統進行降維處理,計算得出能夠反映長白山科學院實驗基地林型綜合分類指標的數值范圍;同時林型綜合分類指標數值范圍的確定,是以不同主成分因子的特征向量和貢獻率來作為指標權重,這種基于數量分析的分類方法,有效地避免了人為分類的主觀臆斷性,在一定程度上改善和提高了林型分類的質量;因此,在保證研究精確度的前提下,建立了一種較為快速準確的林型數量分類方法,降低了工作難度,提高了研究效率。
(2)研究結果表明,所選取的9種林型分類指標,多數指標之間的相關性顯著,相關系數矩陣中絕對值大于0.3的系數占70%以上;通過主成分分析的降維處理,提取出3個主成分因子,進而得出長白山科學院實驗基地林型綜合分類指標的數值范圍為:雜木林 [-1.456,-1.128]、白樺林[0.303,0.796]、紅松闊葉林[1.286,1.745]、長白落葉松林[-0.256,0.156];對該林型分類方法進行可行性驗證,準確度達90%;因此,基于主成分分析法的林型數量分類方法能夠實現對林型的有效分類。
(3)本研究基于主成分分析建立的林型數量分類方法,在長白山科學院實驗基地得到了較好的驗證,具有一定的普適性,可以推廣到其他溫帶地區進行林型分類實驗的探索。今后對于林型數量分類的研究,可以從植被、土壤、氣候等因素中篩選出更具代表性的林型特征指標,簡化指標體系,提高分類效率,以及對多種數量分析方法進行探索研究。