王春梅,顧行發,余 濤,周 翔,占玉林,韓樂然,謝秋霞
(1.中國科學院 遙感與數字地球研究所,北京 100094; 2.國家高分專項應用技術中心,北京 100094; 3.中國科學院大學,北京 100049)
土壤水分是水文模型、氣候預測模型、干旱監測模型、作物估產模型的重要參量,也是全球氣候變化和陸面數據同化研究的重要數據源[1];因此,準確監測土壤水分具有重要的學術意義和應用價值。傳統的土壤水分監測方法雖然能夠精確測量單點的土壤水分,但不能滿足大尺度、動態監測土壤水分的要求。隨著衛星遙感技術的發展與完善,基于衛星可見光-近紅外及熱紅外數據、主動微波、被動微波的土壤水分監測方法相繼研發,這使得大尺度、動態監測土壤水分成為可能。鑒于對土壤水分的強敏感性和高時間重復性,被動微波遙感數據已成為陸表土壤水分遙感產品的主要數據源,在全球土壤水分監測中具有廣闊的應用前景[2-3]。國內外各知名研究機構都在發布自己的全球土壤水分遙感產品,如美國的AMSR-E和SMAP、歐洲太空局的SMOS MIRAS和我國的FY-3。
然而,目前遙感信息產品的真實性檢驗工作嚴重滯后,這使得區域尺度的遙感信息與地面測量尺度的地表觀測信息脫節,進而制約了定量遙感產品在不同領域更好的推廣與應用。隨著業務化和工程化進程對定量遙感產品精度要求的不斷提高,遙感數據信息產品的真實性檢驗變得極為重要。
研究表明,星載被動微波遙感的土壤水分反演效果并未達到預期精度(0.07 cm3·cm-3或0.04 cm3·cm-3),產品低精度與產品間不一致性的問題與“用戶”的實用需求矛盾突出,極大限制了遙感產品的實用價值[4-7]。現有的土壤水分業務化反演算法都是針對均值地表發展起來的,在異質性地表上的土壤水分反演效果沒有得到充分的真實性檢驗。然而,受遙感器件與成像原理的限制,被動微波衛星空間分辨率多為幾十千米(如AMSR-E 數據為25 km,SMOS MIRAS 數據約為40 km,FY-3數據為25 km),低空間分辨率的特性決定了微波像元內部的異質性,即單一微波像元內存在多種地物或某種參數的多種取值,像元內的異質性給土壤水分產品的真實性檢驗帶來了困難。
真實性檢驗是用來評價遙感數據產品、信息產品的真實性和準確性的,也就是常提到的“約定真值”。遙感數據的本質是采樣,特性是其時空分布規律,因此構建出觀測對象的參數場分布是對各類衛星獲得的信息產品檢驗的依據[5-6,8]。最大化地接近真值,就要求在相同的時間地點,產品數值不僅一致,而且變化特征也要一致,并根據不同的物理量,具有相同的梯度、旋度與散度。
遙感數據信息產品真實性檢驗的核心問題是如何利用有限的地面直接或非直接測量數據,構建完整信息的觀測參數時空場。其不僅能夠代表衛星觀測尺度值,而且能揭示空間異質性規律,確保對觀測參數尺度信息的有效承載,為遙感數據信息產品提供驗證數據。
觀測參數時空場的構建涉及地面觀測、同步觀測、尺度轉換等關鍵環節,可通過2個途徑進行構建[8-10]。其一,在觀測參數時空變異特征分析的基礎上發展尺度上推策略,來利用地面實測點數據為遙感信息產品提供定標和驗證服務,技術的本質可以理解為“點代面”;其二,利用多源信息融合技術,集成地面觀測點、模型模擬、遙感數據所反映的和觀測參量相關聯的自然要素或相關指標所反映的觀測參量的時空分布信息,為遙感驗證提供信息量更豐富、精度更高的時空場地面真值,技術的本質為“多源信息融合”,這樣也可以充分發揮海量遙感大數據的作用。
常用的被動微波土壤水分遙感產品真實性檢驗方法,主要有實測樣本數據檢驗、影像數據交叉檢驗、模型模擬檢驗、影響因素檢驗和傳統地統計檢驗。本文查閱了大量文獻,列出了不同檢驗方法研究的主要情況,簡要分析了5種方法的優缺點和實際應用。
影像數據交叉檢驗是基于航空數據或更高分辨率的衛星數據等價產品而進行的檢驗方法,這也是Modis陸表產品檢驗的重要手段[31-33]。航空數據雖然分辨率較高,但是價格比較昂貴,用于低分辨率尺度的土壤水分檢驗成本高昂。同時,由于過境時云的存在,同一區域很難連續獲得高質量的影像,這極大地限制了地面同步觀測的高分辨率衛星、航空數據的檢驗能力,不適宜用作低分辨率土壤水分產品的通用檢驗方法。
為了克服缺少土壤水分實測數據、氣象站數據的缺陷,陸面過程模擬檢驗和聯系相關變量檢驗方法越來越成為低分辨率遙感產品檢驗的主流方法。陸面過程模式是近30 a來以地球陸地表面物質、能量和水分的交換與運輸為理論基礎,以數字地形分析、GIS技術和數學方法為技術手段發展起來的陸表過程模式,已經成為近年來氣象學、水文學研究的一個非常活躍的領域。模擬所采用的要素包括地形、植被、氣象,以及其他環境因素。土壤水分是陸面過程的主要參量之一,可以利用陸面過程模型模擬土壤水分結果,制作土壤水分的高分辨率趨勢面參考圖,但模擬精度受模式結構和輸入數據的影響比較明顯[7-9,18-19,24,34-35]。
Crow等[19]于2012年提出,土壤水分的影響因素包括土壤質地、地形、植被、氣象要素等。目前,國內外利用影響因素作為先驗知識的土壤水分遙感產品檢驗研究有很多[19,36-39]。Tuttle等[40]于2014年利用降雨數據對AMSR-E土壤水分數據進行了檢驗;邱玉寶等[41]于2007年開展了AMSR-E被動微波土壤水分與降雨時空的相關性分析;Lakshmi等[42]于1997年利用歸一化植被指數(NDVI)的變化對土壤水分反演誤差進行檢驗;張濤等[43]于2012年通過理論模擬方法研究了土壤質地類型對土壤水分反演精度的影響。先驗知識與土壤水分之間的關系非常復雜。既有的研究大多是基于單一參量或多參量的簡單相關或回歸統計,多限于對變化趨勢性的定性檢驗,有關土壤水分與多源先驗知識的綜合性定量研究尤為缺乏[43]。
地統計檢驗是一種綜合考慮先驗知識和實測數據的思路方法。利用協同克里格、回歸克里格、分層克里格、地理權重回歸等,均能得到衛星觀測尺度的土壤水分參考圖,在先驗知識與土壤水分相關性較強時,這些方法的檢驗精度均高于普通克里格方法;但這些方法在綜合利用多源數據類型的先驗知識信息方面仍顯不足[44-48]:如協同克里格只能兼顧單個數值類型的環境因子,分層克里格只是將環境信息作為一個分層或分類依據等。
如表1所示,實測樣本數據檢驗方法以樣點的空間代表性為前提,但其方法本身仍存在著一些不足,如缺乏對先驗知識的有效利用,導致檢驗真值精度降低,而且要求的地面監測網絡數據集不易滿足等。模型模擬檢驗和影響因素檢驗的理論依據都是土壤水分與先驗知識的關系,但都忽略了樣點的重要性。地統計檢驗(協同克里格、回歸克里格、分層克里格等)是一種綜合思路,綜合考慮了樣點和先驗知識,但該方法在綜合利用多源數據類型的先驗知識信息方面仍顯不足。

表1 不同檢驗方法的優缺點分析
如何更好地將地面測量和先驗知識兩種思想融合起來,如何高效兼顧樣點空間相關性和多源類型先驗知識的關系,提高觀測參數時空場的構建精度非常重要。為此,需要深入開展土壤水分與多源先驗知識集的綜合性定量研究。
目前,有研究者嘗試將貝葉斯最大熵理論(BME)應用到多源數據融合過程中,尤其是將和目標參量具有相關性的不確定性數據融入空間估計過程中,以發揮貝葉斯理論的優勢;同時,在數據融合策略基礎上,構建貝葉斯理論框架下的地面觀測站點數據升尺度方法,有效利用海量多源遙感數據,以獲取區域更高精度的目標參量空間分布信息,為遙感反演信息產品提供更可靠的驗證數據。
1.2 實驗病毒 柯薩奇病毒B組3型(Coxsackievirus B3,CVB3)由本院微生物病毒研究室提供,經Hela細胞活化,反復凍融3次后檢測組織細胞感染率TCID50:10-3/mL。
Christakos于1990年提出了BME方法,并稱其為現代地統計學;因此,BME檢驗方法屬于現代地統計檢驗范疇,是在傳統地統計檢驗方法上的改進[45,48-50]。在綜合利用多源數據類型的先驗知識信息方面,BME檢驗方法是一個極具創新的方法,具有比較突出的優勢。
BME檢驗方法進行大尺度空間異質性研究能融合多方面具有不同精度與質量的數據,并將這些數據分為2方面:(1)專用數據(KS)。按照數據的精確與否分為硬數據和軟數據兩類,兩類數據均定量表示被研究屬性的含量,區別在于硬數據為確定性的值,而軟數據的值具有模糊性質,形式為值域區間或概率分布,如對某個點位的田間觀測近似數據、從土壤制圖中獲取的土壤質地分布等。相對于硬數據而言,軟數據具有模糊性、獲取容易、成本低等特點。(2)普遍知識/數據(KG)。用來描述空間隨機域的整體特征的數據或知識,如一般自然規律、經驗知識和基于硬數據任何階的統計動差(如數學期望、協方差、方差等)。
基于這兩方面數據,BME方法分為2個步驟:(1)使用KG,基于最大熵原理,計算研究區域內未測點變量分布的先驗概率密度函數(以下簡稱pdf),而且當僅考慮硬數據統計誤差時,所得結果與實地樣本數據檢驗結果一樣。(2)使用KS,基于貝葉斯條件概率,更新上一步獲取的先驗pdf,得到研究區域內未測點的后驗pdf。根據最終得到的后驗pdf,可以方便地制作衛星觀測尺度的土壤水分數字參考地圖,進而對遙感土壤水分產品進行檢驗。
在BME檢驗中,簡單有效的軟數據構造方式可大大提高檢驗評價的預測效果,然而土壤水分產品檢驗的相關研究中對于軟數據的應用形式還比較有限。目前常用的軟數據模型是環境相關法,下面詳細介紹。
根據環境相關法的思想,土壤水分含量在不同環境的影響下可能會產生不同的空間分布特征。通過將土壤水分屬性和輔助變量[包括數字高程模型(DEM)、土地利用現狀圖、Modis產品、FY-3號土壤水分產品]離散化,利用離散型的概率分布逼近土壤水分概率真實分布,從而達到預測的目的。
設待預測土壤水分Z的觀測值范圍為[Zmin,Zmax],根據精度要求將該值域范圍等分為n個含量類別,則第k(1≤k≤n)組含量類別(記為Zk)可表示為[44]
(1)
據此,將建模樣點上Z的含量大小劃分為n個組。同時,與Z類似,可將輔助變量(記為E)的值域劃分為m個值區間。根據輔助變量類型的不同,劃分方法也有所不同。具體而言:如果E是連續型輔助變量(如地形因子和基于遙感影像的指數),則E的值域被等分為m個區間(E1,E2,…,Ei,…,Em);如果E是范疇型輔助變量(如土壤質地、土壤類型),則m為E的水平個數,而Ei則為E的某個具體水平(如土壤質地中的重壤)。
對于E的每一個區間Ei,依次判斷建模樣點上的E取值對其的歸屬性,結合Z含量的劃分,可得到一個類似于直方圖類型的Ei下Z取值的概率分布,用該取值概率分布R(Z,E)來表示Z和Ei的定量關系,用公式表示為
(2)
其中:l∈[1,m],Ci為所有建模樣點上輔助變量E的取值屬于Ei的個數,Count(l)i為第l間隔類內輔助變量E的取值屬于Ei的所占個數。待預測土壤水分與輔助變量之間的完整定量關系可表示為
(3)
對于某一個特定的空間點位u,其上輔助變量E的取值是一個確定值。假設其值屬于Ei,那么u上在輔助變量E影響下的土壤水分概率分布可記為P(Z,E)u:
P(Z,E)u=R(Z,Ei)u。
(4)
如果在該點位u上,存在著多種輔助變量取值,即E是多個輔助變量的集合:A,B,C,...∈E,則可按以上方法同時獲取u上在多個輔助變量影響下的土壤水分概率分布。考慮到不同輔助變量與待預測土壤水分之間的相關性不同,引入它們之間的相關系數作為權重rE。對于連續型輔助變量,采用其與土壤水分的皮爾森相關系數作為權重;對于范疇型輔助變量,采用其與土壤水分的斯皮爾曼相關系數作為權重。為了能同時使用這些相關系數,權重需歸一化(ωE=rE/∑rE,E=A,B,C,…)。最后,基于歸一化的權重和輔助變量影響下的土壤水分概率,可得到任意點位上基于土壤環境相關法的土壤水分概率分布,該概率分布的期望值即為土壤環境相關法的預測值。
基于BME方法的應用研究已經成功地運用于土壤分類、城市熱島、氣溶膠、土壤有機質等參數的空間估算研究[45,48-52]。另外,BME方法還被運用于流行病時空建模、生態與資源調查、氣象氣候研究等涉及自然資源與現象空間分布的多個領域。
在貝葉斯理論框架下開展土壤水分地面真值研究。根據環境相關法的思想,土壤水分含量在不同環境的影響下可能會產生不同的空間分布特征。通過將土壤水分屬性和輔助變量離散化,利用離散型的概率分布逼近土壤水分概率真實分布,即可達到預測目的。Qin等[53]于2013年開展的研究正是這種策略的典型代表,通過貝葉斯線性擬合的方式將Modis表觀熱慣量數據作為輔助數據集成到升尺度過程中,成功地將稀疏站點的土壤水分觀測數據升尺度到了微波遙感土壤水分產品(AMSRE-2 or SMOS)的像元尺度。由此可見,融合多源信息可以認為是一種強大的大數據分析轉換策略。在土壤水分真實性檢驗應用中,可以憑借土壤水分和相關變量(如地表溫度、植被指數、地形指數、氣象數據等)之間的統計關系,嘗試以先驗變量數據集為輔助數據,利用BME方法融合土壤水分觀測數據和先驗變量數據集數據進行土壤水分的空間估計。
可以預見,BME貝葉斯最大熵方法提供了靈活的數據利用方式,使多種來源、多種類型的數據集有機會同時被用于衛星觀測尺度的空間分析,能夠綜合各種先驗信息與樣本信息,是一種可靠的真實性檢驗方法[54]。
如何獲取可以代表衛星觀測尺度“真值”、并能表征空間異質性的土壤水分觀測場,成為被動微波土壤水分產品真實性檢驗的關鍵問題。本文介紹了實測樣本數據檢驗、影像數據交叉檢驗、模型模擬檢驗、影響因素檢驗和傳統地統計檢驗。目前,有嘗試將貝葉斯最大熵理論(BME)應用到多源數據融合過程中,并已在其他領域得到了廣泛的應用。基于此,BME方法有望發展成為一種可靠的大尺度土壤水分真實性檢驗方法。
在今后的遙感產品真實性檢驗研究中,除了必須開展大規模、多樣本的長時間序列、多空間維度的地面測量外,還要盡可能收集更多的先驗數據集,建立綜合數據庫,使多種來源、多種類型的數據集有機會同時被用于不同觀測尺度的時空分析,以便采用BME最大熵理論方法,生成具有“完整”信息的觀測參數時空場參考真值,用于研究時空變化規律,評價信息一致的參考場地狀態,并在此基礎上,完成遙感信息產品的真實性檢驗。