999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

物種分布模型的發展及評價方法

2015-03-10 08:44:16許仲林彭煥華彭守璋
生態學報 2015年2期
關鍵詞:物種評價模型

許仲林,彭煥華, 彭守璋

1 新疆大學資源與環境科學學院,烏魯木齊 830046 2 新疆大學智慧城市與環境建模重點實驗室, 烏魯木齊 830046 3 中國科學院武漢植物園,武漢 430074 4 草地農業生態系統國家重點實驗室,蘭州大學生命科學學院,蘭州 730000

物種分布模型的發展及評價方法

許仲林1, 2,*,彭煥華3, 彭守璋4

1 新疆大學資源與環境科學學院,烏魯木齊 830046 2 新疆大學智慧城市與環境建模重點實驗室, 烏魯木齊 830046 3 中國科學院武漢植物園,武漢 430074 4 草地農業生態系統國家重點實驗室,蘭州大學生命科學學院,蘭州 730000

物種分布模型已被廣泛地應用于以保護區規劃、氣候變化對物種分布的影響等為目的的研究?;仡櫫艘呀浀玫綇V泛應用的多種物種分布模型,總結了評價模型性能的方法?;谖锓N分布模型的發展和應用以及性能評價中尚存在的問題,本文認為:在物種分布模型中集成樣本選擇模塊能夠避免模型預測過程中的過度擬合及欠擬合,增加變量選擇模塊可評估和降低變量之間自相關性的影響,增加生物因子以及將物種對環境的適應性機制(及擴散行為特征)和潛在分布模型進行結合,是提高模型預測性能的可行方案;在模型性能的評價方面,采用赤池信息量可對模型的預測性能進行客觀評價。相關建議可為物種分布建模提供參考。

物種分布模型;性能評價;閾值相關;閾值無關

物種分布模型(Species Distribution Models, SDMs),是將物種的分布樣本信息和對應的環境變量信息進行關聯得出物種的分布與環境變量之間的關系,并將這種關系應用于所研究的區域,對目標物種的分布進行估計的模型。物種分布模型的理論基礎,是生態位的概念,生態位被定義為生態系統中的種群在時間和空間上所占據的位置及其與其他種群之間的關系與作用[1]。Hutchinson以數學方式描述了生態位的概念: 在由多個環境變量定義的多維空間內,能夠維持穩定種群的“超體積(Hyper-volume)”[1]。圍繞如何界定“超體積”,生態學家進行了各種嘗試并依據不同的界定方法,發展了不同的物種分布模型。目前,物種分布模型已經成為基礎生態學和生物地理學研究的重要工具,被廣泛用于研究全球變化背景下物種的分布和氣候之間的關系[2- 5]、區域氣候變化對植物群落和功能的影響[6- 7]、生態系統功能群和關鍵種的監測和預測[8]、生態系統不同尺度多樣性的管理和保護[9]、外來物種入侵區域的預測[10]、面向生態系統恢復的關鍵物種的潛在分布預測和保護區規劃[11]等。物種分布模型的廣泛應用,應考慮模型的性能評價。因此,對模型的性能進行評價的方法,也是模型的應用過程中值得重點關注的問題。本文首先對物種分布模型的發展過程和評價方法進行了回顧,其次總結了物種分布模型的發展和性能評價方面目前存在的問題并提出了可能的解決方案。

1 物種分布模型的發展

1.1 物種分布模型簡介

物種分布模型的發展,始于BIOCLIM模型[12]的開發和應用,隨后的20多年內,涌現了HABITAT、DOMAIN、生態位因子分析模型(Ecological Niche Factor Analysis, ENFA)、馬氏距離(Mahalanobis Distance, MD)、邊界函數方法(Border Function, BF)、最大熵模(Maximum Entropy, Maxent)、廣義線性模型(Generalized Linear Model, GLM)、廣義加法模型(Generalized Additive Model, GAM)、分類與回歸樹模型(Classification and Regression Tree, CART)、推動回歸樹模型(Boosted Regression Tree, BRT)、多元適應性回歸樣條(Multivariate Adaptive Regression Splines, MARS)等基于統計的和基于規則集的遺傳算法(Genetic Algorithm for Rule-set Prediction, GARP)、人工神經網絡(Artificial Neural Network, ANN)等基于人工智能的模型。

BIOCLIM模型將生態位定義為在環境變量空間中包含所有研究物種樣本的超體積[12]。按照此定義,該超體積是一個以各環境變量的極值(極大值和極小值)界定的超矩形,超矩形所界定的變量范圍都被認為是適合于物種分布的。這種定義的缺陷在于,極限環境條件也被認為能夠維持種群的穩定,這是不合理的,因為在極限環境條件下,物種雖然能夠存活,但是不能維持種群的延續。因此,為減少極值對模型性能的影響,提高模型的預測能力,通常在界定多維超矩形的邊界之前,對所有樣本上的各變量值進行排序,在其中選擇一定數量的極值樣本(例如最高的5%)并對這些環境變量的極值進行平均處理以得到超矩形的邊界,由此估計物種的潛在分布區。

HABITAT模型將生態位定義為物種在環境變量空間上的凸殼[13],與BIOCLIM模型不同,在環境變量空間中HABITAT模型不再將環境變量的極值作為生態位的邊界,即邊界不再是剛性的,而以樣本本身所對應環境變量的一個鄰域作為適宜物種分布的環境條件,這樣就排除了某些極限環境條件。遺憾的是,HABITAT模型對邊界的刻畫仍然依賴于外圍樣本。

基于Gower距離算法的DOMAIN模型利用點-點的相似矩陣計算目標點上環境變量的適宜性,該適宜性表示了在環境變量空間中(而非現實分布空間中),目標點與離它最近的分布樣本點之間的相似程度[14]。在確定物種的生境或者分布范圍時,首先需要確定一個閾值以排除非適宜分布區。與之前BIOCLIM方法相比,DOMAIN模型在環境變量空間中確定的環境超矩形并不一定是連續的。

生態位因子分析模型(ENFA)通過計算邊際性和環境偏差來度量目標點的適宜性[15]。在一維情況下,邊際性表現為該環境變量的值域上,分布樣本點所對應的環境變量的均值(樣本均值)與研究區所有點對應的環境變量的均值(全局均值)之間的差;環境偏差其實就是該環境變量的樣本方差與全局方差之間的差別。在多維情況下,邊際性和環境偏差以多維向量的形式表示。在確定了邊際性和環境偏差之后,應用閾值對環境條件進行篩選,可得到物種在環境變量空間中的適宜范圍, 將其映射到實際研究區,便可得到物種的分布區域[15]。

MD方法首先計算樣本上各環境變量的平均值,并統計研究區各點上的環境變量到該平均值的Mahalanobis距離,依據一定的方法確定一個閾值用以確定生境空間的邊界。Mahalanobis距離算法計算得出的橢圓形超體積能夠有效的表達環境變量之間的關系[16]。

BF模型以邊界函數界定物種在環境變量空間上的邊界。以二維環境變量(V1和V2)空間為例,邊界函數的確定方法分為以下步驟: 首先,收集物種分布樣本及與之相關的環境變量V1和V2,并作散點圖;其次,對其中的一個變量(例如V1)進行分段并取各段的中值(或均值),對各段V1值相對應的V2進行排序,選擇一定比例(如5%)的極值并統計極值的平均;再次,在對每一段進行相應分析之后,可得一系列環境變量對偶值,對這些值進行擬合,便可得環境變量的邊界函數[17- 18],對影響研究物種分布的各環境變量都進行相應的分析,則可得出物種在整個環境變量空間上的邊界;最后,將所得邊界映射至研究區的環境變量,便可估計物種的潛在分布區。該方法更加準確的刻畫了環境變量空間上的生態位,其缺憾在于相關計算和處理較為繁瑣。

Maxent模型基于熱力學第二定理。按照該定律,一個非均衡的生命系統通過與環境的物質和能量交換以保持其存在,也就是說,一個實測存在的系統具有“耗散”的特征,耗散使系統的熵不斷增加,直至該生命系統與環境的熵最大,而使熵達到最大的狀態,也是系統與環境之間的關系達到平衡的狀態。在物種潛在分布的相關研究中,可將物種與其生長環境視為一個系統,通過計算系統具有最大熵時的狀態參數確定物種和環境之間的穩定關系,并以此估計物種的分布[19]。基于該原則,最大熵模型在已知樣本點和對應環境變量的基礎上,通過擬合具有熵值最大的概率分布對物種的潛在分布作出估計。最大熵模型自2006年被開發以來,得到了非常廣泛的應用,現已被眾多相關研究所采用[20- 24]。

GLM模型被廣泛的應用于物種的潛在分布建模。由于觀測樣本為布爾值(1為存在分布,0為不存在),而不是連續變量,因此無法構建線性回歸模型,于是轉而預測物種出現(1)或不出現(0)的概率μ。此概率μ取值0—1,為連續變量。然而,若以環境變量為預測變量、μ為應變量,仍無法建立合理的線性回歸模型,這是因為物種分布概率與環境變量之間的關系往往不是線性相關的。因此,將問題轉為求概率μ的轉化形式log(μ/(1-μ))與環境變量的線性函數,在確定了此函數的參數后,再推求μ,便可得各環境條件下物種分布的概率[25]。

GLM模型是多元線性回歸模型的推廣,事實上,廣義線性模型所得物種分布的概率是多維環境變量空間中的一個響應曲面,但該曲面對真實概率的擬合程度受樣本數量的影響較大,即樣本量越大,擬合程度越好,對潛在分布的估計越合理;反之,若樣本量較少,則由廣義線性模型估算的潛在分布概率不太可靠。另外,廣義線性模型的響應變量需要服從高斯分布或者其他對稱分布,但物種的響應曲面很可能不是對稱的,因此即便增加擬合參數(如增加二次項),也不能很好的逼近真實響應曲面[26]。在這種情況下, GAM模型由于能夠逼近更豐富的響應曲面而得到了廣泛的應用[27]。此外,廣義相加模型受數據而不是模型驅動,即它能夠按照數據的結構而不是預先設定的模型(例如高斯分布)對數據進行擬合,因此較廣義線性模型更適用[28]。

CART模型通過二值遞歸分割產生二叉樹,在每一個可能的節點根據變量的值進行判斷并將變量的所有值分割為兩個子類。每一次分割都只基于單個變量值,在此過程中,有些變量值可能會被采用多次,而另外一些變量值則可能不會被采用。在每一次分割之后,能夠保證包含在兩子類中的變量值是“有區別的最大化”。兩個子類的變量值根據一定的準則被繼續分割,直至達到分類的目的。在物種潛在分布模擬中,通常以物種分布樣本上各變量的極值作為節點進行分割。

GARP模型利用物種的分布數據和環境數據運行產生不同規則的集合,判斷物種的生態需求,然后預測物種的潛在分布區。GARP模型是一個反復迭代,尋找最優種類分布規則的過程[29],在模型中,遺傳算法本身并不能刻畫生物分布與環境因子的關系,被用來刻畫這種關系的是“規則(Rule)”,如Range規則,Atomic規則,Logit規則等等,遺傳算法的作用是為這些規則尋找最大的參數。GARP模型具有以下優點: 首先,它能快速有效的搜索多變量空間;其次,遺傳算法是一種非參數方法,它對變量所屬總體的統計分布形式沒有嚴格要求;第三,GARP模型中集成了多類規則,各類規則之間的互補提高了GARP的模擬能力。

1.2 各物種分布模型的性能表現

應用本文提及的物種分布模型,Elith等對分布于全球6個不同地區的226種物種(澳大利亞濕潤赤道地區的鳥類和植物種、加拿大安大略省的鳥類、澳大利亞新南威爾士州的植物種、哺乳動物和爬行動物種、新西蘭的植物種、南美5個國家的植物種以及瑞士的植物種)的空間分布進行了模擬研究,并根據實測樣本數據對結果進行了評價,相關結論認為,Maxent模型具有較好的性能表現[4]。自2006年被開發以來,應用該模型進行物種保護區規劃、入侵物種的潛在分布預測以及物種的空間分布對氣候變化的響應等研究的報道已超過2000次,這也從另一個側面說明了相關研究領域對該模型的認可程度。GLM模型、GAM模型和GARP模型的性能位于Maxent模型之后,但優于DOMAIN模型和BIOCLIM模型[4]。Tsor等選擇分布于以色列的42種蛇類、鳥類和蝙蝠物種進行了空間分布的研究和相關模型的性能評價,結論也同樣認為,BIOCLIM模型的性能較差[30]。對其他模型性能的評價結果,卻與Elith等的結果有所區別:GARP模型和MD模型的性能優異,HABITAT模型、DOMAIN模型和ENFA模型的性能次之。關于物種分布模型性能評價的最新結果顯示:選用不同的性能評價手段對模型的性能進行評價,會導致得出不同的結果;另外,若對適宜分布區范圍較小的物種進行空間分布的模擬,則模型之間的差異較大,相反,若研究物種的分布較為廣泛,則各模型的性能表現出較高的一致性[31]。

2 物種分布模型的評價方法

物種分布模型對潛在分布的預測,一般以布爾值(1表示潛在分布,0表示潛在不分布)或連續值(概率大小表示物種分布的可能性)給出模擬結果。對應的物種分布模型評價方法,也分為兩類: 閾值相關方法(Threshold-dependent)和閾值無關方法(Threshold-independent)。兩類方法都需要首先定義誤差矩陣(表1),若令樣本總數為n,則誤差矩陣的基本元素分別為實測分布、預測也分布的元素a,實測未分布、預測也為未分布的元素d,實測未分布、預測分布的元素b(Commission error)和實測分布、預測未分布的元素c(Omission error)。

表1 誤差矩陣Table 1 Confusion matrix

2.1 閾值相關法

閾值相關法指可被直接用以評價輸出結果為布爾值(1表示潛在分布,0表示潛在不分布)的模型的評價方法。如表2所示,閾值相關的評價方法包括總體精度、敏感性、特異性、預測分布準確率、預測未分布準確率、預測分布似然比、預測未分布似然比、真實技巧統計值、分布-未分布比值比、尤拉Y系數(Yule′s Y)、尤拉Q系數(Yule′s Q)、φ系數(Phi coefficient)、卡帕系數(Kappa)、歸一化互信息量和極端相關值.

表2 物種分布模型的閾值相關評價方法[32]Table 2 Threshold-dependent accuracy measures of species distribution models[32]

在這些指數中,總體精度粗略的反應了模型預測結果與觀測樣本相吻合的程度。敏感性和特異性是條件概率,前者指模型預測分布的樣本個數占實測分布樣本總數的比例,后者指預測未分布樣本個數占實測未分布樣本總數的比例??梢钥吹剑舾行院吞禺愋允腔趯崪y觀測樣本的準確性評價指數,對應的,可以構建基于預測結果的準確性評價指數——預測分布準確率(與敏感性相對應,建議稱為預測敏感性)和預測未分布準確率(與特異性相對應,建議稱為預測特異性),前者指實測分布的樣本個數占預測分布總數的比例,后者指實測未分布的樣本個數占預測未分布樣本總數的比例。由這些指數的定義可知,它們的值域為[0,1],且值越高表明模型的性能越好。

預測分布似然比和預測未分布似然比最早被用以進行醫學診斷,由定義(表2)可知,預測分布似然比指實測分布樣本中被準確預測為分布的樣本與實測未分布樣本中被錯誤預測為分布樣本的比例,對應的,預測未分布似然比指實測分布中被錯誤預測為未分布的樣本與實測未分布樣本中被準確預測為未分布樣本之間的比例,在計算過程中,如果b為零,則預測分布似然比無意義,若d為零,則預測未分布似然比無意義。由于同時考慮了敏感性和特異性,因此相對于單獨采用敏感性和特異性,采用預測分布似然比和預測未分布似然比對模型性能進行評價給出的結果更有效[33]。由定義可知,預測分布似然比和預測未分布似然比取非負值,值域取決于樣本個數,前者的值越大說明模型的預測性能越好,后者則相反,即值越小,模型的性能越好。

Kappa系數在很多研究中得到了非常廣泛的應用,該系數刻畫了模擬值和觀測值之間的接近程度是否大于隨機分配的值。Kappa系數的值域為[0,1]且該值越高表明模型的性能越好。由分布-未分布比值比的定義可以看出,該指數表示預測正確的樣本個數與預測錯誤的樣本個數之間的比值,Fielding和Bell首次將其引入到物種分布建模中進行模型性能的評價[33],分布-未分布比值比在b=0(模型預測未分布而實測記錄到分布的樣本個數為零)或c=0(模型預測分布而實測未分布的樣本個數為零)的情況下是無意義的,但是在模型表現出色的情況下,有可能出現b=0或c=0,因此,在這種情況下,一般為誤差矩陣(表1)中的各元素增加一個微量(如0.1)來計算分布-未分布比值比。分布-未分布比值比為非負值,值域取決于樣本個數,分布-未分布比值比越大,模型性能越優。尤拉Y系數和Q系數相對于分布-未分布比值比更具優勢,因為這兩個指數可被認為是在[-1, 1]上的相關系數,另外,由計算公式可以看出,它們不存在無定義的情況且尤拉Y系數和Q系數越大,模型的預測性能越佳。

極端相關值利用誤差矩陣中的a和c元素對模型的性能進行評價,其值域為[-1, 1],-1表示預測性能極差,1表示極優,0為模型預測性能與隨機分配相當。然而,極端相關值未考慮元素b(實測未分布但預測分布的樣本個數)和d(實測未分布、預測也未分布的樣本個數),因此利用極端相關值進行模型性能評價是不全面的。

2.2 閾值無關法

閾值無關法是與閾值相關法相對應的模型性能評價方法,閾值無關法被定義為能夠評價輸出結果為連續值(而非布爾值)的模型的評價方法,這類方法包括最大總體精度、最大卡帕系數(Maximum kappa)、最大真實技巧統計值、受試者操作特征曲線下面積(AUC)、基尼系數(Gini index)、點二列相關系數、均方差、均方根誤差、決定系數和平均絕對預測誤差??傮w精度、Kappa系數和真實技巧統計值已在閾值相關的評價方法中有所介紹,閾值無關法中與它們相關的評價方法是它們各自的極值。均方差、均方根誤差、決定系數和平均絕對預測誤差是常見的誤差統計值,但在物種分布模型的性能評價中,應用還較少,由于其定義簡單易于理解,因此也不做具體的分析,以下主要分析受試者操作特征曲線下面積AUC(按定義,基尼系數為2AUC- 1,因此也略過對基尼系數的具體分析)、點二列相關系數和平均交叉熵。

表3 物種分布模型的閾值無關評價方法[32]Table 3 Threshold-independent accuracy measures of species distribution models[32]

2.3 適用于不同模型的性能評價手段

按照模型輸出結果的數據類型,可將前述的多種模型分為兩類:布爾型結果模型和概率型結果模型。布爾型結果模型包括BIOCLIM、HABITAT、DOMAIN、ENFA、MD、BF、CART、以及GARP等模型,因此閾值無關法所包含的多種評價方法可被用于評價這些模型的預測性能。概率型結果模型包括Maxent、GLM、GAM、MARS以及ANN等,因該類模型的輸出結果為概率值,因此選擇不同的概率值作為閾值,將對模型的預測結果產生影響。因此,應用閾值相關法包含的多種評價方法對該類模型的性能進行評價是合適的。

3 物種分布模型及評價手段展望

盡管物種分布模型得到了廣泛的應用,但也存在值得深入研究的問題:

首先,分布樣本的選取可能造成預測結果的偏差。由于在樣本采集過程中存在諸如道路便利性、物種的空間分布受到自然或人為因素的干擾等問題,造成收集的樣本集是“有偏的”——即樣本集所代表的生態位只是實際生態位的一部分。因此,若不對樣本集進行以無偏化為目的的選擇和處理,則將造成模擬過程中模型算法過度利用部分區域的樣本擬合物種和環境變量之間的關系,從而產生過度擬合問題。而與此同時,由于另外一些區域的樣本數較少,造成欠擬合。與分布樣點有關的另一個影響因素是:在建模過程中是否考慮不分布樣點的信息。若對物種分布模型按其所需的樣點類型進行分類,可將各種分布模型分為只依賴分布樣點的(Presence-only)和共同依賴分布-不分布樣點的(Presence-absence)模型。Presence-only型模型只依據分布樣點和環境變量之間的關系構建物種與環境條件之間的關系,而Presence-absence型模型除此之外,還考慮不利于物種分布的環境條件的影響。有研究認為,在具備可信的不分布樣點(Absence)情況下,可以考慮采用Presence-absence型模型對物種的潛在分布進行預測[38]。因此,在物種分布模型中集成樣本選擇模塊,以避免模型預測過程中的過度擬合及欠擬合,或允許用戶能夠選擇基于Presence-only或Presence-absence數據對物種的分布進行預測,是值得關注的問題。

其次,環境變量的選擇也將影響模型的預測結果。目前的很多研究,都采用Bioclim數據集合(該集合內的19個生物氣候變量包括溫度、降水量的極值以及變率等)以及坡向、坡度、海拔、歸一化植被指數(NDVI)、植被覆蓋度、土地利用等作為環境變量對陸地生態系統的物種做出潛在分布的估計[39]。然而,這些變量之間存在的自相關在模型預測過程中引入了冗余信息,因此,在進行物種潛在分布建模時,應先考慮對環境變量進行選擇。在諸多模型中,Maxent模型以貢獻率評價各環境變量對物種潛在分布的影響程度,但這種方法也存在一定的局限性[19]。因此,在后續的模型開發過程中,增加變量選擇模塊(如計算方差膨脹因子),以排除冗余信息的影響,是物種分布模型發展中的關鍵問題。

再次,生物因子(如物種間的相互作用)的空間信息難以表達。除以上提及的諸多非生物因子外,生物因子對目標物種的潛在分布也會產生重要的影響。盡管有研究涉及采用生物因子(如收集的競爭物種的空間分布)對目標物種的潛在分布進行預測[39],然而,目前開展的大部分研究都較少引入生物因子進行目標物種空間分布的預測。因而,對生物因子的可信表達和物種間相互作用的考量,也是物種空間分布模型的發展和應用中的前沿問題。需要注意的是,對不同生境類型的物種,需采用不同的方法描述生物因子。例如,影響植物種空間分布的生物因子,可從垂直方向(放牧水平、踩踏程度、植食動物的施肥功能等)和水平方向(以優勢種蓋度所表達的競爭、適應性等)進行描述。而影響動物種潛在分布的生物因子,則宜從其所處食物鏈中的級別進行考慮,例如上級捕食者、同級競爭者和下級捕食對象的空間分布和密度等。

最后,空間外推和時間外推和合理性問題。對物種歷史時期的分布、入侵物種在入侵地的分布以及氣候變化背景下物種分布的估計,是物種分布模型的重要應用方面。然而,相關估計的假設前提,是物種與環境條件之間的關系是均衡的,即物種在新的環境條件下,仍保持與原環境條件之間的關系。這是值得商榷的,因為物種具有對新的環境條件的適應性以及物種本身的空間擴散行為。因此,將物種對環境的適應性機制(及擴散行為特征)和潛在分布模型進行結合,是提高模型預測性能的可行方案。值得考慮的是:物種的適應性和擴散行為,需要根據目標物種的不同而區別對待,較合理的方案,是對適應性和擴散行為進行分級,例如,可將擴散行為分為時間和空間上的充分擴散、部分擴散以及無擴散[40]。

模型性能的評價方面,也存在值得關注的問題:

5 結論

本文回顧了應用較為廣泛的物種分布模型、其性能表現以及現階段對這些模型的指數評價方法。從文獻回顧可知,Maxent、GLM、GAM、GARP以及MD模型的性能相對優異,而HABITAT、DOMAIN和ENFA模型的性能相對較差。物種分布模型的進一步發展,應考慮增加避免過度擬合及欠擬合的模塊,變量選擇模塊、生物變量的空間表達模塊以及物種對新環境變量的適應性機制模塊,以實現對物種空間分布的可信估計。關于對物種性能的評價,現階段被廣泛應用的AUC方法存在缺陷,相關研究中可考慮用PAUC作為替代方案,也可采用AIC指數進行評價。另外,在對各種評價指數的計算中,缺乏對它們的標準差以及置信區間的估計,在進一步的研究中,可通過Z-檢驗(或Monte-Carlo檢驗)的辦法獲得各指數的顯著性檢驗。然而,由于Z-檢驗(或Monte-Carlo檢驗)的實行要求數據符合漸進分布,這就意味著在野外工作中要獲取大量的調查數據。因此,能夠依據有限的樣本對模型的性能進行評價的指數和方法是有價值的。此外,本文列舉的各種參數之間也存在相關性,因此,對它們之間變化關系的研究,也是值得考慮的問題。

[1] Hutchinson G E. The Niche: an Abstractly Inhabited Hyper volume. The Ecological Theatre and the Evolutionary Play. New Haven: Yale University Press, 1995.

[2] 蔣霞, 倪健. 西北干旱區10種荒漠植物地理分布與大氣候的關系及其可能潛在分布區的估測. 植物生態學報, 2005, 29(1): 98- 107.

[3] Anderson R P, Raza A. The effect of the extent of the study region on GIS models of species geographic distributions and estimates of niche evolution: preliminary tests with montane rodents (genus Nephelomys) in Venezuela. Journal of Biogeography, 2010, 37(7): 1378- 1393.

[4] Elith J, Graham C H, Anderson R P, Dudík M, Ferrier S, Guisan A, Hijmans R J, Huettmann F, Leathwick J R, Lehmann A, Li J, Lohmann L G, Loiselle B A, Manion G, Moritz C, Nakamura M, Nakazawa Y, Overton J M, Peterson A T, Phillips S J, Richardson K S, Scachetti-Pereira R, Schapire R E, Soberón J, Williams S, Wisz M S, Zimmermann NE. Novel methods improve prediction of species′ distributions from occurrence data. Ecography, 2006, 29(2): 129- 151.

[5] 翟天慶, 李欣海. 用組合模型綜合比較的方法分析氣候變化對朱鹮潛在生境的影響. 生態學報, 2012, 32(8): 2361- 2370.

[6] 冷文芳, 賀紅士, 布仁倉, 胡遠滿. 中國東北落葉松屬3種植物潛在分布對氣候變化的敏感性分析. 植物生態學報, 2007, 31(5): 825- 833.

[7] 張雷, 劉世榮, 孫鵬森, 王同立. 氣候變化對馬尾松潛在分布影響預估的多模型比較. 植物生態學報, 2011, 35(11): 1091- 1105.

[8] 張志東, 臧潤國. 海南島霸王嶺熱帶天然林景觀中主要木本植物關鍵種的潛在分布. 植物生態學報, 2007, 31(6): 1079- 1091.

[9] Svenning J C, Skov F. The relative roles of environment and history as controls of tree species composition and richness in Europe. Journal of Biogeography, 2005, 32(6): 1019- 1033.

[10] Larson E R, Olden J D. Using avatar species to model the potential distribution of emerging invaders. Global Ecology and Biogeography, 2012, 21(11): 1114- 1125.

[11] Xu Z L, Zhao C Y, Feng Z D. Species distribution models to estimate the deforested area of Picea crassifolia in arid region recently protected: Qilian Mts. national nature reserve (China). Polish Journal of Ecology, 2012, 60(3): 515- 524.

[12] Busby J R. BIOCLIM —A Bioclimate Analysis and Prediction System. Nature Conservation: Cost effective biological surveys and data analysis. Melbourne: CSIRO, 1991: 64- 68.

[13] Walker PA, Cocks KD. HABITAT: a procedure for modeling a disjoint environmental envelop for a plant or animal species. Global Ecology and Biogeography Letters, 1991, 1(4): 108- 118.

[14] Carpenter G, Gillison A N, Winter J. DOMAIN: a flexible modelling procedure for mapping potential distributions of plants and animals. Biodiversity and Conservation, 1993, 2(6): 667- 680.

[15] Hirzel A H, Hausser J, Chessel D, Perrin N. Ecological niche factor analysis: How to compute habitat-suitability maps without absence data? Ecology, 2002, 83(7): 2027- 2036.

[16] Farber O, Kadmon R. Assessment of alternative approaches for bioclimatic modeling with special emphasis on the Mahalanobis distance. Ecological Modelling, 2003, 160(1/2): 115- 130.

[17] 許仲林, 趙傳燕, 馮兆東. 祁連山青海云杉林物種分布模型與變量相異指數. 蘭州大學學報: 自然科學版, 2011, 47(4): 55- 63.

[18] Zhao C Y, Nan Z R, Cheng G D, Zhang J H, Feng Z D. GIS-assisted modelling of the spatial distribution of Qinghai spruce (Piceacrassifolia) in the Qilian Mountains, northwestern China based on biophysical parameters. Ecological Modelling, 2006, 191(3/4): 487- 500.

[19] Phillips S J, Anderson R P, Schapire R E. Maximum entropy modeling of species geographic distribution. Ecological Modelling, 2006, 190(3): 231- 259.

[20] 馬松梅, 張明理, 張宏祥, 孟宏虎, 陳曦. 利用最大熵模型和規則集遺傳算法模型預測孑遺植物裸果木的潛在地理分布及格局. 植物生態學報, 2010, 34(11): 1327- 1335.

[21] 張穎, 李君, 林蔚, 強勝. 基于最大熵生態位元模型的入侵雜草春飛蓬在中國潛在分布區的預測. 應用生態學報, 2012, 22(11): 2970- 2976.

[22] 段居琦, 周廣勝. 我國單季稻種植區的氣候適宜性. 應用生態學報, 2012, 23(2): 426- 432.

[23] Xu Z L, Zhao C Y, Feng Z D, Peng H H, Wang C. The impact of climate change on potential distribution of species in semi-arid region: a case study of Qinghai spruce (Piceacrassifolia) in Qilian Mountain, Gansu province, China // Proceeding of the 2009 IEEE International Geoscience and Remote Sensing Symposium. Cape Town: IEEE, 3: III412-III415.

[24] Xu Z L, Zhao C Y, Feng Z D, Zhang F, Sher H, Wang C, Peng H H, Wang Y, Zhao Y, Wang Y, Peng S Z, Zheng X L. Estimating realized and potential carbon storage benefits from reforestation and afforestation under climate change: a case study of the Qinghai spruce forests in the Qilian Mountains, northwestern China. Mitigation and Adaptation Strategies for Global Change, 2013, 18(8): 1257- 1268.

[25] 戚鵬程. 基于GIS的隴西黃土高原落葉闊葉林潛在分布及潛在凈初級生產力的模擬研究 [D]. 蘭州: 蘭州大學, 2009.

[26] 朱源, 康慕誼. 排序和廣義線性模型與廣義可加模型在植物種與環境關系研究中的應用. 生態學雜志, 2005, 24(7): 807- 811.

[27] 溫仲明, 赫曉慧, 焦峰, 焦菊英. 延河流域本氏針茅(Stipabungeana)分布預測——廣義相加模型及其應用. 生態學報, 2008, 28(1): 192- 201.

[28] Yee T W, Mitchell N D. Generalized additive models in plant ecology. Journal of Vegetation Science, 1991, 2(5): 587- 602.

[29] Li S C, Gao J B. Prediction of spatial distribution of Eupatorium adenophorum sprengel based on GARP model: A case study in longitudinal range-gorge region of Yunnan Province. Chinese Journal of Ecology, 2008, 27(9): 1531- 1536.

[30] Tsoar A, Allouche O, Steinitz O, Rotem D, Kadmon R. A comparative evaluation of presence-only methods for modelling species distribution. Diversity and Distributions, 2007, 13(4): 397- 405.

[31] Aguirre-Gutiérrez J, Carvalheiro L G, Polce C, van Loon E E, Raes N, Reemer M, Biesmeijer J C. Fit-for-Purpose: Species Distribution Model Performance Depends on Evaluation Criteria - Dutch Hoverflies as a Case Study. PLoS One, 2013, 8(5): e63708.

[32] Liu C, White M, Newell G. Measuring and comparing the accuracy of species distribution models with presence-absence data. Ecography, 2011, 34(2): 232- 243.

[33] Riddle D L, Stratford P W. Interpreting validity indexes for diagnostic tests: an illustration using the Berg balance test. Physical Therapy, 1999, 79(10): 939- 948.

[34] Fielding A H, Bell J F. A review of methods for the assessment of prediction errors in conservation presence/absence models. Environmental Conservation, 1997, 24(1): 38- 49.

[35] Manel S, Williams H C, Ormerod S J. Evaluating presence-absence models in ecology: the need to account for prevalence. Journal of Applied Ecology, 2001, 38(5): 921- 931.

[36] Raes N, ter Steege H. A null-model for significance testing of presence-only species distribution models. Ecography, 2007, 30(5): 727- 736.

[37] Tate R F. Correlation between a discrete and a continuous variable: point-biserial correlation. The Annals of Mathematical Statistics, 1954, 25(3): 603- 607.

[38] Li W K, Guo Q H. How to assess the prediction accuracy of species presence-absence models without absence data? Ecography, 2013, 36(7): 788- 799.

[39] Slater H, Michael E, Baylis M. Predicting the Current and Future Potential Distributions of Lymphatic Filariasis in Africa Using Maximum Entropy Ecological Niche Modelling. PloS ONE, 2012, 7(2), e32202.

[40] Godsoe W, Harmon L J. How do species interactions affect species distribution models? Ecography, 2012, 35(9): 8111- 820.

[41] Lobo J M, Jiménez-Valverde A, Real R. AUC: a misleading measure of the performance of predictive distribution models. Global Ecology and Biogeography, 2008, 17(2): 145- 151.

[42] Akaike H. A new look at the statistical model identification. IEEE Transactions on Automatic Control, 1974, 19(6): 716- 723.

[43] Warren D L, Seifert S N. Ecological niche modeling in Maxent: the importance of model complexity and the performance of model selection criteria. Ecological Application, 2011, 21(2): 335- 342.

The development and evaluation of species distribution models

XU Zhonglin1, 2,*, PENG Huanhua3, PENG Shouzhang4

1CollegeofResourcesandEnvironmentScience,XinjiangUniversity,Urumqi830046,China2KeyLaboratoryofCityIntellectualizingandEnvironmentModelling,XinjiangUniversity,Urumqi830046,China3WuhanBotannicalGarden,ChineseAcademyofSciences,Wuhan430074,China4StateKeyLaboratoryofGrasslandAgro-ecosystems,SchoolofLifeScience,LanzhouUniversity,Lanzhou730000,China

Species distribution models (SDMs) have been used in various applications, such as conservation planning, determining the impact of climate change on species distribution, and others. SDMs allow construction of the correlation relationship between occurrence of a target species and environmental conditions (including bioclimatic and anthropogenic conditions). The correlation relationship can then be applied to the entire environmental space to predict the potential distribution of a target species. In the present study, we first review widely-used SDMs and summarize their evaluation approaches. Generally, SDMs can be classified into two categories according to the data required for construction of the correlation relationship, i.e., SDMs that predict the potential distribution of species based on presence-only records (PO models), and SDMs that use presence-absence records (PA models). If reliable absence records are available, PA models are suggested. Additional classification of SDMs is based on output format, namely, SDMs that give prediction results in the format of continuous probabilities (the higher the probability, the more suitable for distribution), and those with results in the format of binary values (1 for suitable and 0 for unsuitable). According to the various SDM output formats, SDM performance can be evaluated by threshold-independent (for models with continuous probabilities) and threshold-dependent (for models with binary prediction) strategies. Threshold-independent strategies can be realized by calculating values of maximum overall accuracy, maximum kappa, maximum vertical distance, area under the receiver operating characteristic (ROC) Curve (AUC), Gini index, point biserial correlation coefficient, mean square error, root mean square error, coefficient of determination, mean absolute prediction error, and others. Threshold-dependent strategies can be realized by calculating values of sensitivity, specificity, positive predictive value, negative predictive value, positive likelihood ratio, negative likelihood ratio, true skill statistic, odds ratio, Yule′s Y, Yule′s Q, Phi coefficient, Kappa, normalized mutual information, extreme dependency score, and others. Based on existing problems related to the development, application and evaluation of SDMs, the present study suggests the following. (1) Because biased presence samples can influence the result of prediction, integrating a sample selection module in the SDM could improve the reliability of model prediction. (2) Bioclimatic variables (such as WorldClim) that are calculated from a Digital Elevation Model (DEM) may co-linearly correlate with each other, and such collinearity may result in overfitting when modeling the potential distribution of a species. As a result, selecting variables based on calculation of the Variance Inflation Factor (VIF) is a suitable means to avoid overfitting. (3) In addition to abiotic factors, biotic factors are also important determinants for species distribution. Thus, the use of biotic variables could improve the model results, although biotic factors are not easy to delineate within a geographic space. (4) The spatial and temporal extrapolation of SDMs, which deal with problems of species potential distribution at different geographic ranges and time points (past and/or future), respectively, are actually based on the assumption of an equilibrium relationship between the target species and environmental conditions. However, this assumption is challenged, because species have the abilities of adaption and dispersal. (5) The Partial AUC (PAUC) is suitable for evaluation of single model performance, and the Akaike Information Criterion (AIC) could provide an objective evaluation of the performance of several SDMs.

species distribution models; performance evaluation; threshold-dependent; threshold-independent

國家自然科學基金資助(41361098)

2013- 04- 03;

日期:2014- 03- 25

10.5846/stxb201304030600

*通訊作者Corresponding author.E-mail: galinwa@gmail.com

許仲林,彭煥華, 彭守璋.物種分布模型的發展及評價方法.生態學報,2015,35(2):557- 567.

Xu Z L, Peng H H, Peng S Z.The development and evaluation of species distribution models.Acta Ecologica Sinica,2015,35(2):557- 567.

猜你喜歡
物種評價模型
一半模型
吃光入侵物種真的是解決之道嗎?
英語世界(2023年10期)2023-11-17 09:18:18
SBR改性瀝青的穩定性評價
石油瀝青(2021年4期)2021-10-14 08:50:44
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
回首2018,這些新物種值得關注
電咖再造新物種
汽車觀察(2018年10期)2018-11-06 07:05:26
3D打印中的模型分割與打包
瘋狂的外來入侵物種
基于Moodle的學習評價
主站蜘蛛池模板: 免费亚洲成人| 久久久久亚洲AV成人网站软件| 在线观看国产一区二区三区99| 欧美一区二区三区国产精品| 国产男人天堂| 亚洲男人的天堂视频| 乱色熟女综合一区二区| 国产一区二区三区精品欧美日韩| 毛片手机在线看| 国产精品久久自在自线观看| 午夜人性色福利无码视频在线观看| 国产手机在线小视频免费观看| 日本午夜影院| 丰满人妻一区二区三区视频| 亚洲色图欧美在线| 乱系列中文字幕在线视频| 午夜日b视频| 青草精品视频| 天堂岛国av无码免费无禁网站| 深爱婷婷激情网| 日韩欧美成人高清在线观看| 玖玖免费视频在线观看 | 日韩a级毛片| 666精品国产精品亚洲| 成年人国产网站| 亚洲欧洲天堂色AV| 欧美一级专区免费大片| 久久不卡国产精品无码| 午夜色综合| 狠狠干欧美| 亚洲AV成人一区二区三区AV| 丁香婷婷在线视频| 激情爆乳一区二区| 亚洲成aⅴ人在线观看| 一区二区午夜| 中国美女**毛片录像在线| 国产福利一区在线| 五月激情综合网| 色成人亚洲| 在线观看视频一区二区| 国产激情无码一区二区三区免费| 国产成人亚洲综合a∨婷婷| 亚洲视频黄| 成人伊人色一区二区三区| 亚洲天天更新| 71pao成人国产永久免费视频| 欧美不卡视频在线观看| jizz在线观看| 中文字幕一区二区人妻电影| 精品无码日韩国产不卡av| 中文字幕日韩视频欧美一区| 久久精品最新免费国产成人| 999精品免费视频| 91美女视频在线观看| 欧美中文字幕无线码视频| 久久精品丝袜高跟鞋| 久久96热在精品国产高清| 亚洲综合激情另类专区| 国产激爽大片高清在线观看| 伊大人香蕉久久网欧美| 久久99蜜桃精品久久久久小说| 亚洲人网站| 亚洲嫩模喷白浆| 国产成人亚洲精品无码电影| 自拍偷拍欧美| 精品视频在线观看你懂的一区| 国产真实乱子伦视频播放| 国产成人精品一区二区秒拍1o| 国产激爽爽爽大片在线观看| 国产二级毛片| 天天综合网亚洲网站| 国产色婷婷视频在线观看| 亚洲系列无码专区偷窥无码| 午夜在线不卡| 玩两个丰满老熟女久久网| 亚洲一级毛片在线观| 2020极品精品国产 | 国产97视频在线| 亚洲 欧美 日韩综合一区| 久久亚洲国产一区二区| 欧美亚洲一区二区三区导航| 免费观看国产小粉嫩喷水|