潘雅楠,張虹,2,章鵬飛,裴蘇婷,范建友,劉守金,2
1.安徽中醫藥大學藥學院,安徽 合肥 230013; 2.安徽省中醫藥科學院中藥資源保護與開發研究所,安徽 合肥 230013; 3.霍邱縣中醫院,安徽 霍邱 237400
杠板歸為蓼科蓼屬植物杠板歸Polygonum perfoliatumL.的干燥地上部分,具有清熱解毒、利水消腫、止咳功效,用于咽喉腫痛、肺熱咳嗽、小兒頓咳、水腫尿少、濕熱瀉痢、濕疹、癤腫和蛇蟲咬傷[1]。杠板歸生長對土壤要求不高,且分布廣泛,野生資源豐富,但隨著市場需求增加,僅靠野生自然資源已難以滿足市場需求[2-3]。
近幾年,物種分布模型在國內外物種分布預測中應用廣泛,其利用物種分布數據和相關環境變量,根據一定的算法可預測物種潛在分布區。物種分布模型種類眾多,在通過已知分布位點預測潛在分布區方面,最大熵(MaxEnt)模型較其他模型有更好的性能表現[4]。本研究采用MaxEnt模型篩選影響杠板歸分布的主要環境變量,通過杠板歸樣點分布數據和主要環境因子找出其概率分布的MaxEnt,預測適宜分布區,旨在為科學利用杠板歸野生資源,以及合理布局杠板歸栽培用地提供理論依據。
1.1.1 地理分布信息
用于模型構建的杠板歸地理分布數據主要來自中國數字植物標本館(http://www.cvh.org.cn/),包括全國第四次中藥資源普查的部分野外調查數據,共計2 976條相關信息。
1.1.2 環境因子
選取氣候、土壤、地形和植被類型四大類共55個變量作為影響杠板歸地理分布的環境因子。環境因子數據來源于“中藥資源空間信息網格數據庫”(http://www.tcm-resources.com/)。氣候類型數據43個,包括12個月的月降水量和月平均氣溫,以及19個綜合氣候因子;土壤類型數據8個,包括酸堿度(pH值)、土壤的陽離子交換能力、土壤含沙量、土壤含黏土量、土壤亞類、土壤有效水含量等級、土壤質地分類和有機碳含量;地形數據3個,包括海拔、坡度、坡向;植被類型數據1個,為植被亞類。將環境因子數據導入ArcGIS軟件進行預處理,并利用conversion工具轉換為ASCII格式備用。
1.1.3 分析軟件
利用MaxEnt3.3.3軟件(www.cs.princeton.edu/~ schapire/MaxEnt)構建杠板歸地理分布與環境因子關系的模型,在ArcGIS軟件中加載模型運算結果,利用ArcMap10.2制圖。
1.1.4 地圖數據
本研究所用中國地圖國界矢量圖及中國行政區劃圖來源于國家基礎地理信息系統網站(http://nfgis. nsdi.gov.cn/),分辨率1∶400萬。
1.2.1 地理分布信息預處理
篩選重復分布信息,去除只到區或鄉的不具體信息及不準確地名,相近地理分布信息(位于相同區/鄉的數個地理分布信息)只保留1個,最終獲得用于軟件分析的地理分布信息476條,地理分布情況見圖1。將分布點的經緯度信息按照MaxEnt軟件格式要求轉換成植物名、經度和緯度三列表并保存為.csv格式備用。

圖1 杠板歸全國樣點分布
1.2.2 模型建立和環境因子篩選
建立MaxEnt模型構建杠板歸地理分布與環境因子之間的關系。設置模型參數,選擇響應曲線用于反映環境因子適宜度范圍,刀切法用于評價環境因子的重要性,隨機選取用于測試集的杠板歸分布數據占25%,訓練集的數據占75%,最大迭代次數為106,其他參數為軟件默認值。將ASCII格式的55個環境因子及.csv格式的杠板歸地理分布數據導入MaxEnt軟件進行運算,輸出類型為Logistic。根據模型運算結果,去除貢獻率為0的環境因子,多次運算直至結果中無貢獻率為0的變量。由于氣候變量之間存在交叉或潛在相關等不同程度相關性,最終需綜合考慮刀切法和貢獻率結果,篩選出影響杠板歸地理分布的主導環境因子。
1.2.3 模型精確度評價
采用受試者工作特征(ROC)曲線驗證模型靈敏度和特異率,以曲線下面積(AUC)為精確度評價指標。0.5≤AUC<0.6表明模型結果失敗,0.6≤AUC<0.7結果較差,0.7≤AUC<0.8結果一般,0.8≤AUC< 0.9結果良好,0.9≤AUC<1.0結果極好。
1.2.4 適宜分布區預測
根據MaxEnt模型模擬運算杠板歸分布最終結果,將該結果ASCⅡ格式文件導入ArcGIS軟件與中國地圖疊加,用conversion工具完成格式轉換,再對轉換并加載的圖層進行切割處理,最終獲得杠板歸分布概率區劃圖。杠板歸適宜分布區根據適生指數(P值)分為4個等級:P<0.05為非適生區,0.05≤P<0.25為低度適生區,0.25≤P<0.5為中度適生區,0.5≤P< 1.0為高度適生區。
經多次運算,杠板歸生態分布模型均AUC>0.9,篩選貢獻率為0的變量后,得到最終ROC曲線(見圖2)。訓練集AUC=0.955,測試集AUC=0.931,結果表明模型精確度極好,可信度高。

圖2 杠板歸分布預測模型ROC曲線
將55個環境因子導入模型,依次運算7次去除貢獻率為0的變量后,最終剩余25個環境因子。各環境因子貢獻率從高到低排序見表1,選取貢獻率≥2%的環境因子;刀切圖結果見圖3,選取各變量獨立訓練增益>1.4的變量。綜合取兩者都較高的環境因子作為影響杠板歸地理分布的主導環境因子:最濕月降水量、年均降水量、6月份降水量、11月份降水量、最濕季降水量、9月份平均氣溫、植被亞類。7個主導環境因子的貢獻率之和為77.6%。

表1 影響杠板歸分布各環境因子的貢獻率

圖3 杠板歸分布預測模型刀切圖
ArcGIS軟件加載MaxEnt模型預測結果顯示,杠板歸潛在分布區橫縱跨度均較大,氣候類型包括溫帶季風氣候、亞熱帶季風氣候及熱帶季風氣候,適宜分布區主要在東北平原、華北平原、長江中下游平原和四川盆地,高度適生區主要為福建、浙江、江西、重慶、廣東(除南部)、湖南(除東部)、廣西北部、貴州北部、湖北西部、安徽南部、陜西南部、江蘇南部,中度適生區主要為廣東南部、廣西中部和西部、云南中部、貴州中部和南部、四川西部、湖南東部、湖北北部、河南南部、安徽中部、山東南部和東部、河北東北部、遼寧南部和東部、西藏東南部。高度適生區及中度適生區均適宜開展杠板歸的高產、高效栽培。分布區劃見圖4。

圖4 杠板歸適宜分布區劃
本研究采用MaxEnt軟件構建杠板歸地理分布模型,ROC曲線訓練集AUC值為0.955,顯示模型預測結果極好,可以較準確反映杠板歸適宜分布情況。但預測結果不代表實際分布,首先,模型運算隨機選取測試集可能存在誤差,ROC曲線只能在一定程度上反映模型精確度;其次,本研究收集的樣點分布信息不完全準確,部分地理分布信息非近年更新,可能已發生變動。另外,物種生態分布除受環境因子影響外,還包括生物因子和人為因素,如田間及果園內的杠板歸常作為惡性雜草被根除。因此,本研究模型預測結果僅為實際分布提供參考。
對比《中國植物志》[5]、樣本分布位點與模型預測結果,三者的杠板歸地理分布范圍高度吻合,然而,《中國植物志》記載的黑龍江、吉林、遼寧、河北、山東、河南、甘肅、四川、臺灣、海南等地雖有分布,但并非其適宜分布區。預測結果中,貴州適宜分布區范圍與譚濟蒼等[2]研究結果一致,但預測位置更廣,除黔東北及黔北區域,還包括黔東、黔西北及黔中部分地區。另外,《中國植物志》及樣本分布位點未涉及區域(如西藏、山西),模型預測結果中也有分布,說明該分布模型可在已知分布基礎上預測潛在分布。
本研究結果表明,影響杠板歸生態分布的關鍵因子主要為氣候因子而非地形或土壤因子,推測與杠板歸分布范圍廣、海拔跨度大、對土壤要求不高等有關。本研究最終選取主導環境因子均為降水量、氣溫和植被類型,可能緣于杠板歸的生物學特性——適宜光照、水分充足的溫暖環境,年均溫度12~16.5 ℃,年均降水量775~1 400 mm,生長范圍內植被類型單一,植被豐富的原始森林或茂密的次生林少有分布[2-3]。有研究表明,杠板歸種植最適宜區年均降水量為843.4~954 mm[2],低于杠板歸生長的平均水平,說明降水量過多不利于杠板歸生長。杠板歸花期6-8月,多數種子于9月下旬至10月成熟落地,6月份降水量和9月份平均氣溫對杠板歸種子發育和成熟有至關重要的影響,11月份降水量則決定種子存活率。 基于上述研究結果,為促進杠板歸高產、高效栽培,建議選擇高度適生的福建等地,栽培應注意幼苗期除草,保證結實期陽光及水分充足,做好排水工作,避免積水。另據何瑾等[6]研究結果,杠板歸藥材質量與產地有關,應當注意環境因子與藥材質量關系。本研究結果所得杠板歸的適宜分布區是否能同時保證杠板歸藥材質量,可結合不同產地栽培杠板歸的有效成分含量開展進一步研究。