李欣怡 向建軍 谷志容 李永飛
(1吉首大學生物資源與環境科學學院,湖南吉首 416000;2吉首大學生態旅游湖南省重點實驗室,湖南張家界 472000;3湖南八大公山國家級自然保護區管理處,湖南張家界 472000)
全球變化研究是科學評估當前與預測未來氣候和環境演變的必要準備,孢粉分析有助于地質歷史時期的環境反演與恢復,而現代花粉與植被的關系對正確解譯化石孢粉記錄、精準恢復古植被和古氣候具有重要參照意義,數理統計方法是花粉—植被關系研究的重要分析手段。氣候變暖加快、極端災害增多、生物多樣性銳減等一系列變化帶來了巨大挑戰,科學評估當前及合理預測未來氣候和環境變化是解決全球氣候變化問題的必要途徑之一[1]。在此背景下,植被作為地球陸地生態系統的核心,對氣候變化具有敏感性,不同氣候類型伴隨產生與之對應的植被類型[2],研究植被與氣候之間的相互關系和響應機制有助于評價當今全球變化和合理預測未來氣候變化[3]。孢粉作為植物體的生殖細胞,具有體積小、產量大、外壁堅固且易于搬運等特點,并且可以在地層中長期保存[4],一定區域內的孢粉組合可直接反映其相應的植被動態特征和氣候環境變化,從而彌補了全球變化過程研究在時間尺度上的不足。因此,以現代孢粉與化石孢粉為載體,可為反演過去植被變化的過程,解決當今環境存在的問題以及預測未來全球變化的威脅提供重要的基礎資料支持[5],孢粉分析成為研究全球氣候變化的重要手段之一。
受到孢粉自身產量、搬運、保存、來源范圍以及外部環境等多方因素的影響,花粉—植被關系并非簡單的線性關系,花粉在孢粉組合中的含量和植物在植被中的比例并不相等,這降低了利用孢粉重建古植被的準確度[6]。現代花粉與植被關系一直是孢粉學、生態學等研究領域的熱點,研究兩者關系是正確解釋化石孢粉記錄、提高古植被和古氣候重建結果準確性的基礎[7]。此外,近30 年來,學術界對現代花粉與植被、氣候的定量關系研究較少[8]。本文對21 世紀以來數理統計分析方法在現代花粉相關研究中的現狀及應用情況進行了系統梳理,為后續研究提供借鑒。
由于不同植物群落對應的花粉組合不同,并且同一植物群落的花粉組合在不同地區也有較大差異,因此現代花粉的研究范圍已經覆蓋了多個地理單元,在廣度和深度上都有進一步提升。現代花粉的研究起步較早,并相繼建立了可跨洲際甚至全球尺度的地層孢粉數據庫(Neotoma 古生態數據庫)和孢粉形態數據庫(PalDat孢粉形態數據庫)[9],這類研究工作為孢粉分類、花粉—植被關系以及古植被重建等工作奠定了重要基礎。孢粉學家們在了解花粉的現代過程、花粉—植被—氣候關系等方面取得了一定的進展,如Stivrins 等[10]通過水體表層沉積物的現代花粉分析,比較了自然和人工水體中現代花粉所反映的實際植被組成和景觀特征,并發現了現代森林生物量與花粉堆積速率的正相關性,這表明以花粉為基礎的森林生物量重建具有潛在的應用價值。Trachsel等[11]通過STEPPS和REVEALS花粉—植被模型對時代植被重建進行比較,發現STEPPS模型集校準與預測功能于一體,可進行完整的空間重建,但仍受花粉記錄的精度限制。
現代花粉與植被關系的研究區域主要集中分布在東北[12]、華北[13]、西北[14]、西南[15]、東南[16]以及青藏高原東南部地區[17],且大部分都集中在某些特定的小樣本和區域里,而以全國為尺度的研究相對較少[18]。研究區域的主要生態系統包括森林、草原與荒漠,主要氣候類型涉及熱帶、亞熱帶、溫帶與寒溫帶。而人類活動頻繁區等地仍有較大研究空間[19]。
現代花粉研究的主要載體為陸地表層土壤(1~2 cm 表土)、苔蘚、花粉捕捉器和湖泊表層沉積物[20]。由于可用于研究的湖泊資源豐富的地區并不常見,苔蘚在所有植被類型中并非都有足夠數量,在草原和沙漠地區可能沒有苔蘚,而一般來說,表土是草原和荒漠地區除了花粉捕捉器以外唯一可以使用的現代花粉沉積物,因此,表土花粉在現代花粉中占絕大部分。但這類樣品在沉積過程和沉積環境中同化石孢粉(絕大多數來自湖泊沉積環境)不同,其在解釋化石孢粉恢復和重建古植被等方面,具有較大的不確定性。為了能更好地解譯孢粉資料,孢粉學家越來越重視對表土花粉與植被之間定量關系的研究。
現代花粉與植被關系的研究方法多種多樣,其中早期傳統的定性或半定量方法主要是利用顯微鏡觀察孢粉形態特征,并與已知的孢粉數據庫進行比對,確定植物的具體屬、種(亞種)[21],在此基礎上統計分析孢粉在樣品中的數量,以確定植物的相對豐度,將花粉在孢粉組合中的百分含量和植物在植被中的百分比進行比較,研究兩者之間的關系[22]。由于定性或半定量方法具有主觀性,且計算機技術和生態多元統計分析得到發展和應用,現代花粉分析已經轉向利用各種方法、模型的定量研究。數理統計方法在現代花粉研究中具有廣闊的應用前景。根據研究目的不同,選擇合適的生態統計方法和植被重建模型,不僅可以幫助研究人員了解植物的繁殖和傳播方式,更有利于深入了解植被的群落結構、演替過程,以及環境變化對植被生態帶來的影響,為應對氣候變化、保護瀕危植物、維持生物多樣性和維護生態系統穩定性等提供重要技術支撐,是孢粉學、植物學、生態學乃至醫學等領域的重要研究內容之一。
現代花粉研究中常用的生態多元統計分析法分為分類(Classification)/分組(Grouping)和梯度(Gradient)/排序(Ordination)分析兩大核心內容。其中,分類/分組分析包括聚類分析(如層次聚類)、判別分析(如線性辨別分析)等;梯度/排序分析分為非約束性排序(如主成分分析、降趨勢對應分析及主坐標分析)和約束性排序(如典型對應分析、冗余分析)兩大類。兩者的主要區別在于,前者旨在顯示物種樣本或群落樣方沿軸線的最大變化;后者旨在檢測物種沿著環境梯度的變化情況,其需要環境信息對排序圖進行約束。
2.1.1 分類/分組分析聚類分析是孢粉分析中常用的一種多元統計分類方法,其根據樣本特性進行合理分類,量化樣本之間的親疏關系,將相似度較大的樣品聚合為一類,形成分類樹狀圖[23]。該方法被廣泛應用于揭示花粉組合與周圍植被的對應關系研究中,通過對花粉組合進行聚類分析,劃分花粉帶,再同現代植被進行比較。如Cui 等[24]利用44 個東北地區表土花粉樣品探討花粉—植被—氣候關系,聚類分析的結果表明,森林、草甸與草原能被很好地區分開,不同的植被類型對應不同的花粉組合。
判別分析是通過已經確定的類別擬合模型,去判定某一樣本點所屬的類別,若樣品判定結果與所屬植被類型表現一致,則表示花粉組合與植被類型之間具有較好的對應關系[25]。該方法與聚類分析的區別在于,其判定的類別是已知的,即將未分好的類別進行觀測,再劃分到已知的類別中。如李博雅[26]通過對內蒙古高原及其周邊地區92 個湖泊表層沉積物花粉樣品進行判別分析,發現典型草原、森林草原樣品能夠良好地反映其實際的植被類型,但對于花粉含量基本相同、優勢類群基本相同的草甸草原以及花粉信號混亂的荒漠草原,樣品判別能力較弱。
2.1.2 梯度/排序分析主成分分析是探究孢粉組合和植被關系的常用方法,可以將多維變量線性轉化成幾個關鍵的概括性指標,計算出權重,并用于綜合評價,是一種適用于較短環境梯度的數據降維法[27]。例如,郎青等[28]利用主成分分析法分析新疆天山山間盆地表土花粉譜特征,結果表明,花粉組合能很好地區分各個植被帶,各植被帶之間的花粉組合差異明顯,影響植被分布的主要因素是濕度。
降趨勢對應分析是根據花粉的相對含量來區分不同的植被類型,通常用于確定花粉組合與植被和氣候之間的關系,以及比較不同植被類型花粉組合,是一種線性分析法,適用于群落數據和較長環境梯度,特別是當“弓形效應”出現時使用會有較好效果[29]。如李永飛等[15]通過降趨勢對應分析云南麗江老君山表層土壤中花粉與植被的關系,結果表明,花粉的相對濃度可以較好地區分不同的植被類型。
主坐標分析是一種非約束性的數據降維法,用來檢驗數據相似度或相異度,其通過特征向量的提取實現降維,盡可能在低維空間表示樣點之間的關系,以及花粉組合與樣點植被組成的對應關系[30]。花粉和植被數據一般都要求在不同的距離范圍內選取,并且選取計算花粉和植被中的主要花粉類型。如王蒙[31]通過主坐標分析發現大別山區苔蘚樣品中的花粉組合與0~1 500 m范圍內植被數據具有密切關聯。
此外,約束性排序方法中的諸如典型對應分析、冗余分析等,是基于降趨勢對應分析中對梯度長度的分析,以及判斷數據單峰或線性來劃分選擇,以進一步探討影響花粉空間分布特征的環境要素。例如,蔣夢嬌[32]選取滇西南地區78個湖泊水庫的表層沉積物樣品中的現代花粉數據和氣候數據作典型對應分析,結果顯示,年降水量、年均溫度和春季降水量是影響滇西南湖泊水庫表層花粉組合空間分布的重要氣候因子。
近年來,部分研究者在現代花粉—植被定量關系研究中做出了新的嘗試。例如,協慣量分析作為一種可以靈活耦合兩個或兩個以上數據表的方法,被用于計算花粉和植被數據間的相似度[33]。崔巧玉等[34]通過協慣量分析確定了東北地區植被和花粉組合中23個常見類群的相對百分含量,揭示了不同樣點花粉—植被間的強/弱相關性。Bray-Curtis 相異度是生態學中衡量不同樣方間差異性的計算方法,譚斌[35]以東北樣帶和金華北山樣帶為例,將Bray-Curtis 相異系數應用于比較樣方的植物群落和表土孢粉組成和數量關系,以及不同樣方的某一科屬在植物群落和表土孢粉中的組成和數量關系的研究中,結果表明,相異系數在一定程度上反映了地區花粉—植被在組成和數量趨勢上的一致性,但仍受人類活動的干擾影響。
利用計算機模擬模型方法校正花粉與植被間的定量關系,從而解譯較長時期內環境的變化情況,目前這類方法越來越受研究者重視。相對于野外觀測和實驗,該模型的優點在于可以較為直觀地量化花粉—植被間的關系,是一種在理想狀態下探究理論潛力和突破局限性的辦法。隨著R值、拓展R值的ERV(ExtendedR-Value)等模型以及相對花粉產量和相關花粉源范圍等概念的提出,現代花粉的定量模型研究逐漸得到發展和完善,花粉數據庫資料得到了補充。近年來,孢粉學家開始不斷嘗試利用孢粉資料與模型模擬法相結合的方法來重建古植被,現代類比法、生物群區化法和景觀重建法等是目前主要使用的植被重建方法。
2.2.1 現代類比法通過類比現代花粉組合和化石花粉組合,將前者對應的環境參數賦值給后者,以定量模擬古植被組合[36]。該方法的局限性在于植被群落與花粉組合之間的復雜關系使得兩者無法一一對應,例如,來源不同的植被群落可能有相同的孢粉組合,從而難以與現代樣品相匹配,影響恢復的準確性。
2.2.2 生物群區化法以植物功能型特征定義生物群區,依據一定的標準化計算方法將孢粉譜歸類并納入其中,進而定量重建古植被類型[37]。該方法的局限性在于,僅適用于研究大區域尺度上的近似估計值,難以模擬小區域或群落尺度上的植被,較少考慮花粉代表性和植物豐度等因素。
2.2.3 景觀重建法景觀重建法是Sugita[38-39]在構建ERV 模型的基礎上進一步提出的算法,由REVEALS(Regional Estimates of Vegetation Abundance from Large Sites)和LOVE(Local Vegetation Estimates)模型組成,分別用于較大面積(大于50 km2)和較小面積(小于0.1 km2)樣點的植被蓋度計算,其采用花粉產量與化石花粉百分比相結合的方法,并利用數學模型,解釋了從植被到花粉沉積過程中的機制問題,有助于將植被恢復到群落水平,是目前定量重建古植被的主要方法。該方法的局限性在于將模型中的各種復雜因素(如風速、花粉沉降速率等)確定為常數,未考慮地形因素的影響。如郭雁翎[40]通過研究天目山地區主要植物的相對花粉產量和相關花粉源范圍,利用景觀重建算法對重建的植被蓋度與實際植被進行對比,結果表明,重建的相對植被蓋度與調查的植被蓋度相關性較強,證實了景觀重建法在其研究區域具有適用性。
2.2.4 機器學習方法越來越多的學者引入了機器學習的方法進行現代花粉研究。例如,利用隨機森林[41]算法建立孢粉—植被重建模型,基于數據集擬合多個分類樹,并匯總所有分類樹的結果,以做出最終預測。秦鋒[42]通過對青藏高原的草原帶和荒漠帶湖泊表層沉積物的現代花粉研究,嘗試利用隨機森林算法定量重建古植被,并通過與生物群區化法重建的古植被對比發現,前者在青藏高原預測現代植被的準確度更高,不過兩者也各有其優缺點和適用范圍[43]。神經網絡[44]算法可以針對大量不確定的數據在復雜環境下進行樣本學習,然后對問題進行分類和判別,能較準確地揭示多元預測變量(Predictor)與目標響應變量(Response)之間的非線性映射關系,在生態學領域得到廣泛應用。王怡璇等[45]嘗試通過神經網絡算法,利用相關孢粉數據重建某一時期陸地生物群區的空間格局,結果表明,其準確度高于生物群區化法。目前機器學習方法在花粉—植被關系研究中的應用較少,具有較大的發展潛力。
不同學者對現代花粉與植被之間的關系展開了大量研究,隨著生態學、統計學和計算機技術等多學科的發展與融入,現代花粉的定量研究工作將不斷深入和改進。引入的數理統計方法各有其適用范圍,僅憑單一方法不能徹底解決現代花粉與植被的定量之間的關系問題,隨著多種定量重建方法的不斷創新和日趨完善,數理統計在現代花粉研究中的應用將越來越廣泛。
現代花粉的定量研究工作中仍存在有待改進之處。(1)多元統計分析、模型模擬或機器學習等方法在現代花粉研究中的運用,都有其適用范圍和優缺點,未來仍然需要研究者繼續改進,并且鼓勵新方法和新模型的研發與嘗試,以獲得更可信的基礎資料。(2)一定區域內的花粉代表一定區域內的植被組成,其獲得的結論無法在其他地區的相關研究中進行有效應用。現代花粉的研究空間分布并不平衡,例如,亞熱帶地區生態群落結構復雜,人類活動頻繁,使得該片區的現代花粉研究難度加大,定量關系的確定亟須探索更為適宜且有效的方法。(3)花粉的現代過程以及花粉—植被多樣性的復雜關系等對于孢粉學研究至關重要,是定量恢復古植被、古氣候的基礎,目前研究工作進展還有待加快和完善,應促進相關學科進行互補和融合,依托需求提高研究水準。