李宗亮, 陸晨晨, 于向鵬, 劉 潔, 劉 靜, 狄露露, 金海如
(浙江師范大學化學與生命科學學院,浙江金華 321004)
畸形外囊菌(Taphrina deformans(Berk)Tul)是桃縮葉病的病原菌[1],屬于子囊菌亞門,能階段性形成子囊及子囊孢子.它能造成桃樹葉片早落、嫩枝枯死,影響果實品質、產量及其經濟效益.這種病菌不但會侵染桃樹引發縮葉病,而且可以危害李、梅和杏等果樹.
由于外來入侵生物是導致生物多樣性破壞和社會經濟損失的主要原因之一[2],生物入侵逐步成為社會關注的焦點.外來物種一旦在某一個地區入侵成功,人們需要花費大量的精力去檢測該物種的危害性,并尋找根除它的方法[3].防止外來有害生物入侵的重要手段之一是阻止該物種進入其潛在的適生區[4].因此,明確外來物種的適生區對防止生物入侵有著重要的作用.
外來物種在目標地的適生性高低,直接決定了該地區是否存在被該物種入侵的可能性.越來越多的生態研究者認為,外來入侵生物會對當地的生態環境結構帶來不可逆轉的改變及巨大的經濟損失[5].因此,明確畸形外囊菌在中國的適生區,對進一步檢測和控制該入侵物種具有現實指導意義.
畸形外囊菌的分布數據通過文獻記錄、數據庫和標本館(http://www.gbif.org/)等途徑得到,并用Google Earth查閱其具體的地理坐標,共獲得104個分布點(見圖1),并將得到的坐標轉換成模型所需要的格式保存.
圖1為畸形外囊菌的全球數據庫現有分布,主要分布地區為亞洲東部、北美洲、歐洲、非洲中部和大洋洲東部等,這些地區都屬于溫帶地區.

圖1 畸形外囊菌的地理分布圖
基因遺傳算法(GARP)模型是一種基于遺傳算法的規則組合預測模型系統,用來預測物種潛在的地理分布范圍[6].該模型在保護瀕危物種、生物多樣性保護區設計的優先性評估、外來入侵物種擴散潛能及全球氣候變化對物種分布區的影響等研究中得到了廣泛的應用[7].在多變的環境條件下,GARP模型被證明是預測物種適生區的一個非常成功的工具[8].
在GARP系統中,物種分布數據分為2部分[6]:一部分初始數據稱為外部檢驗數據(extrinsic test data),用于完全獨立的模型質量檢測;另一部分數據用作訓練數據(training data)和內部檢驗數據(instrinsic test data),其中,訓練數據用作建立模型,而內部檢驗數據用作內部的模型質量檢驗.
本研究環境數據采用CuCL2數據包,其中包含23種環境數據:年平均光照時間、最冷月份的平均光照時間、最暖月份的平均光照時間、霜凍時的平均光照時間,年平均降水量、最冷月份的平均降水量、最冷季度的平均降水量、最干旱月份的平均降水量、最干旱季度的平均降水量、沒有霜凍時的平均降水量、最暖月份的平均降水量、最暖季度的平均降水量、最濕月份的平均降水量、最濕季度的降水量,年平均溫度、最冷月份的平均溫度、最冷季度的平均溫度、沒有霜凍月份的平均溫度、最暖月份的平均溫度、最暖季度的平均溫度,年平均風速,平均降水量的標準偏差和平均溫度的標準偏差.
受試者工作特征曲線(簡稱ROC曲線)分析方法最初應用于雷達信號接收能力的評價[9],后廣泛應用于醫學診斷實驗性能的評價[10-12].ROC曲線是以預測結果的每一個值作為可能的判斷閾值[13],由此計算得到相應的靈敏度和特異度,以假陽性率(1-特異度)為橫坐標、以真陽性率即靈敏度(1-遺漏率)為縱坐標繪制而成,以其曲線下的面積(AUC)的大小作為模型預測準確度的衡量標準,其范圍為[0,1][14],AUC 的值越高,說明模型的預測準確度也就越高.
圖2為GARP模型運算的ROC曲線及其曲線下的面積(AUC).隨機ROC曲線的AUC值為0.5.AUC的值越大,說明模型的準確性就越高.本研究中AUC的值為0.89,診斷價值為較高.

圖2 GARP模型的ROC曲線
物種預測分布模型會對畸形外囊菌分布區的環境參數進行提取并統計.根據畸形外囊菌分布區的環境參數,GARP模型會自動對全球各個地區的環境進行擬合.擬合度越高的地區,畸形外囊菌的適生可能性就越大;反之,適生性就越小.
圖3是GARP模型擬合的畸形外囊菌在中國的適生區.顏色從純白到純黑,表示適生的可能性從小到大,顏色越深,代表該地區畸形外囊菌的適生概率越大.從圖3可以看出,畸形外囊菌在中國的適生區主要分布在東部地區:河北南部、山西南部、廣東南部、山東全部、河南全部、安徽全部、江蘇全部、上海全部、浙江全部、海南全部、福建大部分、江西大部分、臺灣西部沿海、云南東部、湖北東部和湖南東部.

圖3 基于GARP模型的畸形外囊菌在中國的適生區
本研究中,GARP模型每一次運行時隨機抽取50%的坐標數據作為訓練數據,25%的坐標數據作為外部檢驗數據,剩下的25%作為模型運行后的內部檢驗數據,模型對數據進行了20次重復運算.以獨立模型外部的檢驗數據為基礎的卡方檢驗顯示,GARP模型的運算在統計上是高度顯著的(P=0.01);以內部檢驗數據檢驗模型預測結果,檢驗結果以AUC值的大小來確定模型預測結果的準確度.
ROC曲線下的面積為AUC值,以此反映診斷實驗的價值.一般認為:AUC值在 0.5~0.7時,診斷價值較低;在0.7~0.9時診斷價值中等;大于0.9時診斷價值較高[15].AUC值可對診斷實驗的準確度進行檢測,因而成為目前公認的診斷實驗最佳評價指標[16].本研究中,GARP模型預測的AUC值為0.89,診斷價值較高,因此預測結果具有較高的準確度.
氣候因子在決定物種地理分布方面的重要地位已經被研究者們廣泛接受,世界的生物區系就是根據全球氣候數據進行劃分的.影響物種分布的因素有很多種,例如海拔高度、地形和物種的棲息地環境等[17].盡管還有很多其他的因子同樣影響物種的分布,但根據氣候因子劃分生物區系仍然是宏觀生態學最成功的理論之一[18].
畸形外囊菌在菌絲生長過程中能使宿主細胞內的葉綠體遭到破壞,葉片表面表現皺縮、肥腫、變為黃褐色或紅色等癥狀,造成葉片當年第2次萌發,這樣會直接影響到當年桃子的產量及第2年花芽的形成[19],造成桃子的減產.因此,確定畸形外囊菌在中國的適生區,對預防和有效控制桃樹縮葉病具有一定的現實指導意義.
[1]王欣,侯林洲,李怡萍.桃縮葉病的發生與防治[J].陜西農業科學,2006(1):128.
[2]Ficetola G F,Thuiller W,Miaud C.Prediction and validation of the potential global distribution of a problematic alien invasive species:the American bullfrog[J].Divers Distrib,2007,13(4):476-485.
[3]Hulme P E.Beyond control:wider implications for the management of biological invasions[J].J Appl Ecol,2006,43(5):835-847.
[4]徐汝梅.生物入侵——數據集成、數量分析與預警[M].北京:科學出版社,2003:129-144.
[5]Wittenberg R,Cock M J W.Invasive alien species:a toolkit of best prevention and management practices[M].Oxon:CABI,2001.
[6]Stockwell D,Peters D.The GARP modeling system:problems and solutions to automated spatial prediction[J].Int J Geogr Inf Sci,1999,13(2):143-158.
[7]Guisan A,Thuiller W.Predicting species distribution:offering more than simple habitat models[J].Ecol Lett,2005,8(9):993-1009.
[8]賈文明,周益林,丁勝利,等.外來有害生物風險分析的方法和技術[J].西北農林科技大學學報:自然科學版,2005,33(增刊):195-200.
[9]Leshowitz B.Comparison of ROC curves from one-and two-interval rating-scale procedures[J].J Acoust Soc Am,1969,46(2B):399-402.
[10]Goodenough D J,Rossmann K,Lusted L B.Radiographic applications of receiver operating characteristic(ROC)curves[J].Radiology,1974,110(1):89-95.
[11]Metz C E.Basic principles of ROC analysis[J].Semin Nucl Med,1978,8(4):283-298.
[12]Zweig V H,Cambell G.Receiver operating characteristic(ROC)plots:a fundamental evaluation tool in clinical medicine[J].Clin Chem,1993,39(4):561-577.
[13]Phillips S J,Anderson R P,Schapire R E.Maximum entropy modeling of species geographic distributions[J].Ecol Model,2006,190(3/4):231-259.
[14]Wiley E O,McNyset K M,Peterson A T,et al.Niche modeling and geographic range predictions in the marine environment using a machinelearning algorithm[J].Oceanogr,2003,16(3):120-127.
[15]余松林.醫學統計學[M].北京:人民衛生出版社,2002:164-178.
[16]Vanagas G.Receiver operating characteristic curves and comparison of cardiac surgery risk stratificafi0n systems[J].Interact Cardiovas Thorac Surg,2004,3(2):319-322.
[17]Hodkinson I D.Species response to global environmental change or why ecophysiological models are important:a reply to Davis et al[J].J Anim Ecol,1999,68(6):1259-1262.
[18]Lawton J H.Are there general laws in ecology? [J].Oikos,1999,84(2):177-192.
[19]黃麗麗,康振生,羅志萍.桃縮葉病組織的光學和電子顯微鏡觀察[J].西北農林科技大學學報:自然科學版,1993,21(增刊2):29-34.