圣倩倩,王 晨,王立飛,劉彥辰,耿興敏,祝遵凌
(南京林業大學 a.風景園林學院;b.南方現代林業協同創新中心;c.藝術設計學院,江蘇 南京 210037)
植物物種的地理分布受氣候制約,而氣候影響植物分布的主要因素則是溫度和降水[1-2]。通過對植物物種所需溫度與降水量的統計和模型的建立,可以有效預測其可能存在的地理區位。隨著電腦技術的發展和地理信息系統的應用,各種生態位模型(如BIOCLIM、DOMAIN、MaxEnt、GARP 等)[3-5]都被逐漸開發并應用到植物物種適生區的預測之中。
牡丹是我國四大傳統名花之一,東漢時期已被用作中藥,而其作為觀賞植物的栽培歷史則可追溯至南北朝。牡丹花姿綽約,氣味清香,自有“花王”之相,其觀賞價值很高。中國是牡丹培育生產大國,牡丹種質資源多樣,品質優異,且在其種質利用和產品加工等方面均有相應的產出。近年來,牡丹除了作為傳統的藥用、觀賞植物得以開發利用外,還陸續涌現出一些新興的牡丹產業,這些產業主要涉及食品、化妝品、醫藥保健品及牡丹文化、藝術、服飾等領域[6-8]。為了促進牡丹產業的科學發展,運用地理信息系統軟件DIVAGIS 模擬牡丹最可能分布的適生區域,以期為未來牡丹的保護、引種與推廣提供科學依據[9]。
本研究通過查看標本庫獲得牡丹分布點數據。從中國國家標本資源平臺(http://www.nsii.org.cn/2017/home.php)獲得了827 份標本信息,篩選并保留具體到鄉鎮一級的標本數據,應用百度地圖對標本記錄進行定位,確定經度與緯度[10],最終獲得259個分布點的經緯度數據,并將分布點數據保存為Excel 文件以備用[11]。
選擇19個和物種分布有關的生物氣候變量[12],其中、英文名稱見表1。所有數據均從世界氣候數據庫(https://www.worldclim.org)中獲得,未來的氣候數據則選用CMIP6 計劃下SSP1-2.6 情景中的2081—2100年氣候預測數據和SSP5-8.5 情景中的2081—2100年氣候預測數據。利用ArcGIS 軟件處理從數據庫中下載的生物氣候變量數據,保存為相應格式以備用。

表1 19個生物氣候變量Table 1 19 bioclimatic variables
DOMAIN 模型和BIOCLIM 模型的預測都是利用DIVA-GIS 軟件進行的,即將收集到的牡丹分布點位的坐標輸入到Excel 工作表中,以DBF 文件格式保存。對參與建模的已知的牡丹分布點位數據,按照75%的比例進行隨機分割[13],以隨機選取的75%的“存在點”作為訓練子集,以其余25%的“存在點”與數倍于“存在點”的“不存在點”作為驗證子集,在DIVA-GIS 軟件平臺上依次加載隨機生成的不同訓練子集文件。使用之前生成的生物氣候變量數據集參與模型運算,得到多個分布預測圖,將多個預測值進行平均,獲取基于兩種模型的牡丹在中國的分布圖,然后將得到的分布圖導入ArcGIS 軟件中進行可視化處理。
DOMAIN 模型的輸出值不是牡丹適生可能性的估算值,而是分類置信度[14]。根據DOMAIN 模型運算的結果,需以人為定義的閾值來確定其適生區范圍。將DIVA-GIS 軟件平臺中輸出的grd 格式文件轉換成ArcGIS 相應格式文件,利用ArcGIS軟件使用重分類(Reclassify),對DOMAIN 模型的結果進行可視化處理,參照張海濤等[15]對DOMAIN 模型適生區的分類標準對預測的牡丹適生區進行劃分,即以評價指數為100 的區域作為最佳適生區,以評價指數為97 ~99 的區域作為高適生區,以評價指數為96 ~97 的區域作為適生區,以評價指數為95 ~96 的區域作為低適生區,以評價指數為91 ~95 的區域作為邊緣適生區,以評價指數為0 ~91 的區域作為非適生區。以BIOCLIM 模型對當前氣候條件下牡丹的適生區進行預測,根據系統默認的適生度,可將牡丹的地理適生區分別劃分為非適生區、邊緣適生區、低適生區、適生區、高適生區、最佳適生區這6個等級,其指數分別為0 ~2.5%、2.5%~5.0%、5% ~10%、10% ~20%、20% ~42%。利用ArcGIS 軟件對預測出的不同等級適生區的地理范圍進行最小幾何邊界處理,以WGS1984 坐標系為標準,計算出各等級分布區的經緯度范圍。
提取259個標本分布點所對應的19個生物氣候變量數據,利用SPSS 軟件對提取出的數據進行主成分分析(Principal component analysis,PCA)[16-18],以篩選出當前氣候條件下與牡丹適生區關聯度最大的氣候因素。
模型預測結果數據可以分為如下幾類[19]。
1)模型預測結果中顯示物種存在的數據:以預測結果顯示存在而事實上也存在的數據為真陽性數據,用a來表示;以模型預測結果顯示存在而事實上不存在的數據為假陽性數據,則用b來表示。
2)模型預測結果中顯示物種不存在的數據:以預測結果顯示不存在而事實上也不存在的數據為真陰性數據,用d來表示;以模型預測結果顯示不存在而事實上存在的數據為假陰性數據,則用c來表示。
研究中涉及的評價指標包括靈敏度(真陽性率)、特異度(真陰性率)、準確度與AUC 值和Kappa 值。靈敏度是指預測出的真陽性數據在所有實際存在數據中的比例,特異度是指真陰性數據在所有實際不存在的數據中的比例,準確度是指真陽性結果和真陰性結果在總目標區所占的百分比。以特異度為X坐標,以靈敏度為Y坐標繪制受試者工作特征曲線(Receiver operation characteristic,ROC),受試者工作特征曲線下面積(Area under ROC curve,AUC)是指ROC 曲線下的面積,Kappa 統計值(Kappa statistic,K)是根據靈敏度(Sensitivity,Se)、特異度(Specificity,Sp)、準確度(Accuracy,A)這3個指標值綜合計算后得到的評價指標值,其計算公式分別如下:

利用預測環節隨機分割步驟中得到的驗證子集來檢驗模型預測的精度,同時利用DIVA-GIS 軟件中的ROC 曲線和Kappa 統計值對模型預測精確度進行檢驗[20]。以AUC 值為評判依據,不受診斷閾值的影響,且對物種發生率不敏感,AUC 值目前被公認為最佳的評價指標,在生態位模型精確度檢驗評價中得到了廣泛的應用[21]。其評價模型對適生區的模擬效果分為如下6個等級:極好(0.90~1.00)、好(0.80~0.90)、一般(0.70~0.80)、差(0.60 ~0.70)、失?。?.50 ~0.60)。Kappa值也是被認可的評價指標,其同樣有如下6個評價等級:極好(1.00 ~0.85)、很好(0.70 ~0.85)、好(0.55 ~0.70)、一般(0.40 ~0.55)、失?。ǎ?.40)。
運用Domain 模型預測出的牡丹不同等級適生區的分布情況見表2。由表2 可知,等級較高的牡丹適生區主要分布于北京、天津的大部分地區,河北部分地區,山東大部分地區,河南大部分地區,陜西中南部與甘肅東部地區,四川山地區域與四川盆地交界處以東地區,重慶全境,湖北與重慶、湖南交界地區,湖北西部和東部地區,江蘇部分地區,上海全境,浙江北部地區,貴州大部分地區,江西部分地區等區域。

表2 DOMAIN 模型的預測結果?Table 2 The results of the DOMAIN model
運用BIOCLIM 模型預測出的牡丹不同等級適生區的分布情況見表3。由表3 可知,等級較高的牡丹適生區主要分布于甘肅南部和陜西的中部、南部地區,山西南部地區,河南除東南部外的大部分地區,江蘇中北部地區,山東南部與東部地區,四川和重慶東部地區,貴州東部的大部分地區,湖北大部分地區等區域。

表3 BIOLCIM 模型的預測結果Table 3 The results of the BIOCLIM model
比較分析兩個模型的預測結果可知,以DOMAIN 模型預測出的高適生區更為分散,而以BIOCLIM 模型預測出的高適生區更為集中;以DOMAIN 模型預測出的最佳適生區的面積比以BIOCLIM 模型預測出的最佳適生區面積要小,且這些最佳適生區域集中于已知的牡丹標本分布點附近;而以DOMAIN 模型預測出的最佳適生區、高適生區和適生區面積之和大于以BIOCLIM 模型預測的結果。但是,兩個模型預測的結果都表明,中國中部以陜西和貴州為中心的兩個適生區的面積均較大,牡丹適生的程度均較高。
提取標本點的19個生物氣候變量數據,利用SPSS 軟件對提取出的19個生物氣候變量數據進行主成分分析,結果見表4。在19個主成分中,第1、第2、第3、第4個主成分的方差貢獻率分別為61.820%、18.526%、7.605%、6.245%,其累計貢獻率達94.196%,說明這4個主成分可以反映出大部分生物氣候變量的信息。各個生物氣候變量在前4個主成分中的得分系數見表5。由表5 可知,在第1 主成分中,極端最低氣溫(bio6)、最干燥季度的平均溫度(bio9)、最冷季的平均溫度(bio11)、年降水量(bio12)的得分系數都較高,分別為0.081、0.081、0.080、0.080;在第2 主成分中,溫度季節性變化方差(bio4)、最濕季平均溫度(bio8)、極端最高溫(bio5)的得分系數都較高,分別為0.231、0.217、0.206;在第3 主成分中,季節降水量變異系數(bio15)、最熱季降雨量(bio18)、最濕月降雨量(bio13)的得分系數都較高,分別為0.281、0.265、0.198;在第4 主成分中,最濕月降雨量(bio13)、濕季降水(bio16)、平均日溫差(bio2)、最熱季的降水(bio18)的得分系數都較高,分別為0.374、0.277、0.275、0.275。可見,各個環境因素作用的效果順序為:溫度因素大于濕度因素。在19個生物氣候變量中,對牡丹適生區分布起到主要影響作用的氣候變量分別是極端最低溫度(bio6)、溫度季節性變化方差(bio4)、季節降水量變異系數(bio15)、最濕月降水量(bio13)。

表4 前4個主成分的方差貢獻率Table 4 Variance contribution rate of the first four principal components

表5 旋轉后的因素荷載矩陣Table 5 Rotated factor loading matrix
對DOMAIN 模型預測精度進行檢驗,結果得到的評價指數AUC 值與Kappa 值分別為0.887(圖1)和0.633(圖2)。參考前文所述的模型評價標準可知,DOMAIN 模型對牡丹適生區的預測結果的精度高、模擬效果好。而對BIOCLIM 模型預測精度進行檢驗,結果得到的評價指數AUC值與Kappa 值分別為0.842(圖3)和0.594(圖4),說明以DOMAIN 模型對牡丹適生區預測的精度與模擬的效果要高于和優于以BIOCLIM 模型對其預測的精度與模擬的效果。

圖1 DOMAIN 模型的ROC 曲線Fig.1 ROC curve of DOMAIN model

圖2 DOMAIN 模型的Kappa 統計值Fig.2 Kappa statistic of DOMAIN model

圖3 BOCLIM 模型的ROC 曲線Fig.3 ROC curve of BIOCLIM model

圖4 BIOCLIM 模型的Kappa 統計值Fig.4 Kappa statistic of BIOCLIM model
使用SSP 1-2.6 情景下的19個生物氣候變量和DOMAIN 模型對牡丹在未來氣候條件下的適生區進行預測,結果見表6。SSP 1-2.6 情景是在SSP1的基礎上對RCP 2.6 情景的更新[22]。同理,使用SSP 5-8.5 情景下的19個生物變量和DOMAIN 模型對牡丹在未來氣候條件下的適生區進行預測,結果見表7。SSP 5-8.5 情景是在SSP5 的基礎上對RCP8.5 情景的更新。在這兩種氣候情景下,牡丹適生區僅在小區域內稍有變化,但沒有大面積的變化,說明其適生區的分布狀態穩定。

表6 SSP 1-2.6 情景下DOMAIN 模型的預測結果Table 6 The results of BOCLIM model under the SSP 1-2.6 scenario

表7 SSP 5-8.5 情景下DOMAIN 模型的預測結果Table 7 The results of BOCLIM model under the SSP 5-8.5 scenario
生態位模型理論在物種保護研究中得到了有效的應用。例如,針對目標物種基于生態位模型的模擬結果,可以從宏觀角度了解物種適生區的分布情況,對物種的發現和保護都有積極意義。與GARP、MAXENT、BIOCLIM 這些生態位模型有所不同的是,在參與的變量較少的情況下,DOMAIN 模型對物種適生區的模擬仍有較高的精度。將DOMAIN 和 Neural Ensembles 模型配合起來運用,能有效預測中國毛竹的潛在分布區域[14],DOMAIN 模型在對天麻的適生區的預測中也表現出優異的效果[22]。在未來氣候情景下,牡丹的適生區范圍將有可能碎片化地增加或減少,但不會出現大范圍的變化。
主成分分析結果表明,在前4個主成分中得分系數最高的變量里,溫度因素占據主導地位,極端最低氣溫(bio6)與溫度季節性變化方差(bio4)這2個變量為影響牡丹適生區分布的主要氣候因素。對前4個主成分中得分系數最高的生物氣候變量數據進行處理,得到牡丹適生區的氣候特征(表8),由極端最低氣溫的變化范圍值可知,牡丹適生區的溫度最低值為-21 ~5 ℃,因為牡丹有深度休眠的特性,需要在1 ~10 ℃的環境下通過冷處理來解除深休眠。一般情況下,牡丹能耐受的最低溫度為-30 ℃,因此適于牡丹分布的區域需要有明顯的季節性溫度變化特性和適宜的最低溫,而不適宜的溫度條件會導致牡丹生長停滯。有關研究結果[23-25]表明,溫度對牡丹的影響最大,是影響牡丹生長的關鍵氣候因素。結合主成分分析結果來看,溫度是需要首先考慮的氣候因素,相對于溫度而言,牡丹對水分的需求具有更高的普適性。

表8 牡丹適生區的氣候特征Table 8 Climatic characters in the suitable habitat of P.suffruticosa Andr.
在全國范圍內,牡丹適生區等級較高的區域主要分布于北京和天津的大部分地區、河北部分地區、山東大部分地區、河南大部分地區、陜西中南部地區、甘肅東部地區、四川東部地區、重慶大部分地區、湖北部分地區、湖南部分地區、江蘇部分地區、安徽部分地區、上海大部分地區、浙江北部地區、貴州大部分地區、江西部分地區等區域。南部地區適生區的分布形狀與大山脈、江河走勢基本一致,這是因為氣溫年較差等溫度因素與地形、海拔等因素密切相關,依據農業氣候相似性理論,模型預測出的適生區的氣候環境條件與采樣點的氣候環境條件相似,因此,這些氣候環境條件基本可以滿足牡丹生存所需。但是,植物的生長除了受到溫度、水分條件的制約之外,人類活動、土壤條件等都會影響植物的生長,例如都市化和工業化過程中產生的二氧化氮(NO2)會對植物生長產生影響[26],土壤堿化會影響植物的生理代謝[27]。因此,未能結合人類活動和土壤條件等環境變量來預測牡丹適生區也是本研究的不足之處,今后需對此問題進行更加深入的研究。