趙 紅,王成杰
(中國海洋大學 數學科學學院,山東 青島 266100)
基于SMOS衛星數據的海表面鹽度模型
趙 紅,王成杰
(中國海洋大學 數學科學學院,山東青島266100)
海表面鹽度是研究海洋對全球氣候影響以及大洋環流的重要參量之一,而衛星遙感技術是獲取海表面鹽度數據的最有效方法。目前,L波段的SMOS和Aquarius/SAC-D遙感衛星正在用于探測海表面鹽度,并根據衛星觀測數據和物理機制反演出海表面鹽度的產品。但在某些近陸地區域,由于淡水流入及陸地射頻(RFI)等因素影響,衛星反演鹽度的產品精度較低。文中利用“東方紅2號”科學考察船的實測數據、SMOS衛星數據,首次針對中國南海海域提出了用貝葉斯網絡模型計算海表面鹽度,并用驗證數據集(實測Argo鹽度)對模型進行適應性評估。經過計算,模型誤差和驗證誤差分別為0.47 psu和0.45 psu,而相應的SMOS Level 2產品的精度分別為1.90 psu和1.82 psu。此模型為海表面鹽度的計算提供了一個新方法。
海表面鹽度;SMOS衛星;貝葉斯網絡;統計模型
極端的氣候變化對人類活動乃至生存環境帶來了巨大的挑戰,科學家們正在通過不懈的努力來預知并緩和這種氣候變化。通過不斷的研究,人們發現全球水循環在緩和氣候變化上起到了重要的作用。而全球水循環中的一個重要的參量就是海表面鹽度,它的時空變化和分布規律對了解全球海水狀況以及海洋在海-氣這一復雜體系中的作用有著重要意義。同時,許多學科如氣象學、生態學、水文學和漁業等領域也都在關注海表面鹽度的獲取和進一步研究。
全球海洋如此廣闊,如何對海洋進行有效的探測與研究呢?目前為止,衛星遙感技術是最有效的技術來源之一,而微波遙感由于其可穿透云層且晝夜可行,能夠滿足人們全天時、天候對海洋監測的需求。目前在海表面溫度(SST)、風速等海洋參數的獲取上廣泛采用了微波輻射計,其提供的大量數據可以用于全球氣候分析和數值預報,在大尺度、連續快速、全球測量能力等方面具有明顯優勢。從空間探測海洋鹽度的計劃始于1998年,目前有兩顆衛星在執行任務。一顆是由西班牙、法國和歐洲空間航天局共同研制的 SMOS(Soil Moisture and Ocean Salinity)衛星,主要任務是測量海洋鹽度和土壤的濕度。該衛星于2009年11月發射升空,在運轉期間,將提供分辨率為200 km×200 km的10~30 d平均的全球大洋鹽度數據,精度預計達到0.1 psu[1-3];另一顆是美國和阿根廷聯合開發的Aquarius/SACD衛星,包含用來測量海水鹽度的L波段輻射計和測量海洋表面粗糙度的L波段散射計兩個有效載荷。Aquarius/SAC-D衛星計劃經過月平均和150 km×150 km的空間平均后達到0.2 psu的精度。
自衛星發射以來,國外一些學者針對全球海域對衛星數據進行大尺度評估[4-6],如法國海洋開發研究所Coriolis中心設計開發了基于最優插值技術的ISAS(In Situ analysis system)溫鹽分析系統[7-8];美國Scripps海洋所構建了氣候態溫鹽分布場[9];日本氣象局首次實現了全球溫鹽圖的常規化制作[10]。另外,英國氣象局[11]、印度國家海洋信息中心[12]等也分別研制了各自的衛星遙感產品。Rannala B,Yang Z[13]利用OI SST為模板變量,通過混合算法得到SMOS海表鹽度產品。目前,利用現有的反演算法得到的全球海表面鹽度衛星遙感產品如圖1,該圖是2015年2月22日-26日5天平均的海表面鹽度空間分布圖,鹽度的變化范圍為30~40 psu。圖中白色區域是沒有得到有效的鹽度產品的海域。

圖1 2015年2月22-26日5 d平均海表面鹽度SSS3分布圖
利用衛星遙感數據來反演海表面鹽度的科學研究最早見于光學遙感,最早可追溯到1982年Khorram的工作[14]。Khorram基于實測的鹽度數據和Landsat多光譜掃描儀數據(MSS),利用多元線性回歸模型,建立了舊金山灣三角洲區域的鹽度反演算法。很多學者在Khorram的工作基礎上,相繼開展了基于陸地衛星Landsat或SPOT數據的鹽度遙感反演工作[15-17],其中Wang基于多元線性回歸的統計方法在美國墨西哥灣海岸大型河口湖利用衛星遙感來探測湖面的鹽度。
由于受到陸地射頻(RFI)、海表溫度(SST)以及強風場等因素的嚴重影響,衛星遙感鹽度反演模型和算法不適用于中國近岸海域,特別是南海海域(如圖1中黑框內的區域)。基于衛星遙感數據建立適用于中國南海海域海表面鹽度的反演模型是目前我國海洋建設過程中需要迫切解決的問題。本文根據“東方紅2號”科學考察船的實測數據,采用貝葉斯網絡方法對SMOS衛星的Level 2產品進行進一步的修正,得到了精度更高的海表面鹽度產品。
寬闊大洋海域受到淡水流入及陸地射頻的影響較小,因此SMOS衛星和Aquarius/SAC-D衛星在此類海域的預測精度較高。但是在一些近陸地海域,兩顆衛星的產品精度卻不盡如人意。本文主要考慮中國南海海域(4°N~25°N,105°E~125°E),通過貝葉斯網絡統計模型來建立更加精確的海表面鹽度的反演算法。
1.1實測數據集
本文采用的實測數據是“東方紅2號”科學考察船在2012年4月1日到6月15日南海海域巡航期間所采集到的浮標鹽度數據。“東方紅2號”是中國海洋大學用于綜合海洋巡航調查的科考船,此次巡航共放置了46個停泊浮標(圖2),獲取了包括鹽度、溫度、風速等多個海洋參數。所有浮標的鹽度數據經過去噪音、天平均等處理后,共得到了鹽度的實測數據(in-situ SSS)1 348個。

圖2 “東方紅2號”科學考察船在中國南海海域放置的停泊浮標的位置
1.2Argo數據集
Argo(Array for Real-time Geostrophic 0ceanography)俗稱“Argo全球海洋觀測網”,是迄今為止人類歷史上第一個提供全球海洋次表層信息的觀測系統。Argo浮標可以在海洋中自主浮沉,隨洋流漂流,同時自主定位和測量多種海洋數據,包括海水鹽度、溫度等。Argo剖面浮標觀測資料以其水平分布廣、垂直深度深、數據量大、精度高的優勢,逐漸成為海洋觀測信息的重要來源,有助于更準確、更全面地了解全球氣候的變化。
1.3SMOS衛星數據集
SMOS衛星是歐洲空間航天局(European Space Agency,ESA)“地球探索者機遇”項目中的第二顆衛星。SMOS衛星主要產品是Level 2級數據產品,其反演算法是通過最小化迭代函數來定義[18]。這種方法不可避免地會存在反演誤差,誤差源包括亮溫觀測不精確、近陸污染和無線電頻率干擾等;太陽/大氣等外源誤差,海水介電常數模型不精確、依賴于海表狀態的粗糙度模型不精確等環節可能產生的誤差。在SMOS衛星發射之后,許多科學家致力于共同努力來移除、削弱或修正這些誤差,并在寬闊海域內得到了較精確的結果。但是在某些海域,尤其是近陸地區域,受到人為噪音等干擾,常規的RFI檢測方法并不奏效,因此SMOS Level 2鹽度產品的誤差還比較大。本文主要針對這類區域,在SMOS Level 2數據的基礎上建立一種不依賴于物理機制的統計預測方法,得到更加有效的海表面鹽度模型。
1.4數據匹配
在模型的建立過程中,采用的鹽度實測數據是由“東方紅2號”科學考察船采集處理后的數據,亮溫數據是SMOS衛星提供的Level 2數據,即入射角(L2a angle)為42.5°所對應的海表水平的亮溫(TB)。其他的海洋影響變量由SMOS輔助數據提供。根據SMOS衛星鹽度反演的物理機制和前人的研究成果,選取了6個相關的海洋物理參量,包括水平極化亮溫(TBH)、垂直極化亮溫(TBV)、海表面溫度(SST)、有效波高(SWH)、降雨率(RR)和風速(WS)。對于SMOS衛星的Level 2數據與輔助數據,首先通過ESA的Earth Observation On-line Catalogue and Ording Services訂購,利用Beam軟件讀取出來網格化數據點,再按照相同時間相同網格進行匹配,得到包括3種鹽度產品(SSS1,SSS2,SSS3)和6個影響變量(TBH,TBV,SST,SWH,RR和WS)的有效數據2 648 082組(4°N~25°N,105°E~125°E區域,2012年4月-6月)。
衛星數據與現場實測的數據之間會存在時空上的差異,因此在數據匹配時要依據合理的匹配原則。對于每一個現場觀測的鹽度數據,按照該數據的觀測時間和浮標經緯度與同步衛星的數據進行匹配。Busalacchi等[19]提出的匹配原則是時間間隔為1 d,空間匹配半徑為1°,即在時空上都采用最近點(closet point of approach,CPA)原則與實測數據進行匹配。為了更加精確,這里采取的匹配原則是最大時間間隔為12 h,最大空間匹配半徑為0.5°。對于每一個實測的鹽度數據,提取匹配半徑內所有同步的SMOS衛星匹配數據組,取平均值后將兩者進行匹配,得到匹配數據106組。
此數據即采用的訓練數據集,是以后建立海表面鹽度反演模型的數據基礎。此訓練數據集中每一組數據都包含10個變量,分別是目標變量(實測海表面鹽度,即in-situ SSS),影響變量(亮溫TBH、亮溫TBV、海表面溫度SST、有效波高SWH、降雨率RR和風速WS)和對照變量(SMOS SSS1,SSS2, SSS3)。
1.5數據分析
首先,對SMOS Level 2的鹽度數據產品進行誤差分析。對于106組匹配的數據,分析計算了實測變量(in-situ SSS)和對照變量(SMOS SSS1,SSS2,SSS3)的誤差,SMOS 3種鹽度數據的均方根誤差(RMSE)分別是1.90 psu,1.93 psu和1.91 psu(圖3);平均絕對誤差是1.46psu,1.49psu和1.47psu。

圖3 106組時空匹配的實測數據和SMOS衛星產品分布圖

圖4 衛星數據SSS1相對于實測數據的誤差分布圖(106組)
可以看到,SMOS Level 2鹽度產品在此區域是不夠精確的。SMOS的3種鹽度產品的數據都比較接近,為了簡單將SMOS SSS1作為SMOS Level 2的鹽度產品來進行分析和比較。圖4是衛星數據SMOS SSS1的誤差分布圖,變化范圍在-6.32~3.98 psu之間。
同時也將Aquarius/SAC-D的Level 3鹽度數據和46個站位點的鹽度數據按照上面的方式進行時空匹配,得到349個點對。兩種產品的鹽度分布圖和誤差分布圖見圖5。Aquarius/SAC-D鹽度產品略高于實測鹽度,均方根誤差(RMSE)為0.88 psu,平均絕對誤差(MAE)為0.78 psu。可以看到,Aquarius/SAC-D產品的誤差也較大,因此需要建立新的反演模型。

圖5 Aquarius/SAC-D鹽度數據和實測鹽度數據分布圖(上)及誤差分布圖(下)
本節利用貝葉斯網絡模型對海表面鹽度等參數建立統計模型,并利用實測Argo鹽度數據對模型進行評估和檢驗。
2.1貝葉斯網絡
貝葉斯網絡(Bayesian Network,BN)由網絡拓撲結構和條件概率分布族兩部分組成。拓撲結構是有向無環圖(directed acyclic graph,DAG),節點代表變量,節點間的有向邊代表變量間的條件依賴關系。每一個節點都附有一個條件概率分布,即貝葉斯網絡的參數。根據獨立性假設,聯合概率分布可以展開成以下形式:

式中:π(Xi)表示變量Xi的父節點。
連續型貝葉斯網絡中的所有節點變量都是連續型變量,通常假設其參數為多元正態模型。
Kenley C R,Schachter R,Castilo E等[20-22]分別對連續型貝葉斯網絡進行研究,式(1)中的條件分布可以表示為如下形式:

式中:μi是Xi的均值;σ2i是Xi的條件方差;bij是在給定Xi父節點π(Xi)下用來衡量Xj對Xi影響的回歸系數,即變量Xi的預測方程為:

當對參數{μ1,μ2,…,μn},和進行估計后就可以確定預測方程[23]。當模型結構已知時,貝葉斯網絡學習簡稱為參數學習,包括極大似然估計方法[24]和貝葉斯估計方法[25];而對模型結構進行推斷時,稱為結構學習,通常包括即基于約束(Constraint based,CB)的學習算法[26],基于評分(Score-based,SB)的學習算法[27]和混合學習算法[28],其中比較常用的是基于評分算法。
2.2模型結果分析
利用1.4節得到的訓練數據集,對7個變量SSS,TBH,TBV,SST,SWH,WS和RR通過爬山法[29]進行結構學習和參數學習。為了避免局部最優化和結構學習過擬合,以10幅隨機圖作為搜索算法的起點,設置每一個節點的最大父節點個數為4個,選擇BIC作為結構學習的評分函數。最后選擇評分最低的結構(最優結構)作為理想結構進行下一步的參數學習,該結構變量間的關系如圖6。

圖6 貝葉斯網絡結構圖
從得到的網絡結構圖中,可以得到這7個相關變量之間的影響關系。直接影響海表面鹽度SSS的因素是海表面溫度SST、水平極化亮溫TBH和垂直極化亮溫TBV以及降雨率RR。
由于對變量數據并沒有可靠的先驗認識,所以在進行參數學習時并不加先驗,即采用極大似然估計的方法來進行參數估計,得到的條件分布集合為:

當對海表面鹽度變量進行推斷時,由前面的條件分布集合和公式(3),可以得到如下預測公式:

利用鹽度的預測公式(4)可以得到海表面鹽度的擬合值。對于訓練數據集,模型擬合的鹽度值和真實鹽度值的散點圖見圖7,可以看到數據點對比較接近于直線y=x。經過計算,模型的均方根誤差RMSE和平均絕對誤差MAE分別是0.47 psu和0.34 psu,而SMOS SSS1產品的精度分別為1.90 psu和1.46 psu,誤差分布圖見圖7。同時繪制了模型產品和SMOS SSS1的誤差百分比分布圖(圖8),其中99%的模型誤差都集中在-1~1 psu之間,而SMOS SSS1的誤差只有44%,在-1~1 psu之間。

圖7 模型擬合的鹽度值和真實鹽度值的散點圖及誤差分布圖

圖8 模型擬合鹽度以及SMOS鹽度的誤差分布圖
2.3模型驗證
為了對模型進行適應性驗證,選取南海海域2013年4月-6月進行對比研究。訂購下載并用Beam軟件讀取數據,按照1.4提出的原則對數據進行時空匹配,可以得到SMOS衛星3種Level 2鹽度產品(SSS1,SSS2,SSS3)和6個影響變量(TBH,TBV,SST,SWH,RR,WS)。2013年4月、5月和6月南海海域的有效網格點數據各為11 577 985,11 987 166和11 367 069組。通過貝葉斯網絡模型計算可以得到網格點的海表面鹽度,進一步平均后可以得到空間分辨率為1°×1°的單天和月平均數據產品。繪制海表面鹽度的月平均產品空間分布圖(圖9),鹽度數據的變化范圍為32.5~35 psu。

圖9 2013年4月、5月和6月的月平均鹽度產品圖
2013年4月至6月南海海域共有374個有效的Argo浮標(圖10),按照1°×1°的單天平均后和我們的日平均產品以及SMOS Level 2日平均產品進行時空匹配,得到286組匹配數據。圖11(a)是匹配的Argo數據、模型產品和SMOS Level 2產品的分布圖,可以看到模型產品更接近于實測數據(Argo)。圖11(b)是模型產品和SMOS Level 2產品的誤差分布圖。經過計算,均方根誤差RMSE分別為0.45 psu和1.82 psu,進一步說明該產品相對于SMOS Level 2產品具有更高的精度。

圖10 2013年4月到6月南海區域有效的Argo數據的標記地理位置

圖11 (a)匹配段Argo鹽度、模型產品和SMOS Level 2產品的分布圖,(b)匹配的模型產品和SMOS Level 2產品的誤差分布圖
海表面鹽度是研究大洋環流和海洋對全球氣候影響的重要因素。本文通過建立貝葉斯網絡模型,充分利用衛星遙感數據得到了海表面鹽度的預測公式,而且模型精度較高(點對點精度為0.47 psu)。同時,將模型日平均產品與實測Argo數據進行比較,誤差RMSE為0.45 psu,而SMOS衛星Level 2日平均產品的誤差為1.82 psu。此結果說明我們得到的海表面鹽度預測模型可以對SMOS衛星產品進行進一步修正,且具有較好的泛化能力。
在未來的研究中,將進一步嘗試用統計分析的其他方法,如主成分回歸或非線性回歸方法來建立反演模型。進一步考慮陸地射頻、淡水流入等數據對模型的影響,建立適應性更強的模型。
[1]Kerr Y H,Waldteufel P,Wigneron J P,et al.Soil Moisture Retrieval from Space:The Soil Moisture and Ocean Salinity(SMOS)Mission[J].Geoscience and Remote Sensing,IEEE Transactions on,2001,39(8):1729-1735.
[2]Zine S,Boutin J,Waldteufel P,et al.Issues about Retrieving Sea Surface Salinity in Coastal Areas from SMOS Data[J].Geoscience and Remote Sensing,2007,45(7):2061-2072.
[3]Talone M.Contribution to the Improvement of the Soil Moisture and Ocean Salinity(SMOS)Mission Sea Surface Salinity Retrieval Algorithm[D].Universitat Politecnica de Catalunya,2010.
[4]Murtugudde R,Busalacchi A J.SalinityEffects in a Tropical Ocean Model[J].Journal ofGeophysical Research:Oceans(1978-2012),1998,103(C2):3283-3300.
[5]王新新,楊建洪,趙冬至,等.Aquarius/SAC-D衛星鹽度數據在中國南海的準確度評估[J].熱帶海洋學報,2013(5):23-28.
[6]Sen A,CarusoD,DurhamD,et al.Launch and On-Orbit Checkout ofAquarius/SAC-D Observatory:An International Remote Sensing Satellite Mission MeasuringSea Surface Salinity[J].Sensors,Systems,and Next-Generation Satellites XV,2011,8176(3):6012-6015.
[7]Gaillard F,Morin P,Reverdin G.Contribution to the ICES Working Group on Oceanic Hydrography National Report[R].National Report,2013:1-19.
[8]Gaillard F,Charraudeau R.ISAS-V4.1b:Description ofthe Method and User Manual[M].Rapport LPO,2008:08-03.
[9]Roemmich D,Gilson J.The 2004-2008 Mean and Annual Cycle of Temperature,Salinity,and Steric Height in the Global Ocean from the ArgoProgram[J].Progress in Oceanography,2009,82(2):81-100.
[10]Hosoda S,Ohira T,Nakamura T.A Monthly Mean Dataset of Global Oceanic Temperature and Salinity Derived from Argo Float Observations[J].JAMSTECReport ofResearch and Development,2008,8:47-59.
[11]Martin MJ,Hines A,Bell MJ.Data Assimilation in the FOAMOperational Short-Range Ocean Forecasting System:A Description of the Scheme and Its Impact[J].QuarterlyJournal ofthe Royal Meteorological Society,2007,133(625):981-995.
[12]Udaya Bhaskar T V S,Ravichandran M,Devender R.An Operational Objective Analysis System at INCOIS for Generation of Argo Value Added Products[J].2007,1:48.
[13]Umbert M,Hoareau N,Turiel A,et al.NewBlendingAlgorithmtoSynergize Ocean Variables:The Case ofSMOS Sea Surface Salinity Maps[J].Remote SensingofEnvironment,2014,146(5):172-187.
[14]KhorramS.Remote SensingofSalinityin the San FranciscoBayDelta[J].Remote SensingofEnvironment,1982,12(1):15-22.
[15]Baban S MJ.Environmental Monitoring of Estuaries;Estimating and Mapping Various Environmental Indicators in Breydon Water Estuary,U.K.,UsingLandsat TMImagery[J].Estuarine,Coastal and ShelfScience,1997,44(5):589-598.
[16]LaveryP,Pattiaratchi C,Wyllie A,et al.Water QualityMonitoringin Estuarine Waters Usingthe Landsat Thematic Mapper[J].Remote SensingofEnvironment,1993,46(3):268-280.
[17]Wang F,Xu Y J.Development and Application of a Remote Sensing-Based Salinity Prediction Model for a Large Estuarine Lake in the USGulfofMexicoCoast[J].Journal ofHydrology,2008,360(1):184-194.
[18]Gabarró Prats C.StudyofSalinityRetrieval Errors for the SMOSMission[D].Barcelona,2004.
[19]Busalacchi A J,Hackert E C,Alory G,et al.Spatio-Temporal Variability and Error Structure of SSS in the Tropics[C]//AGU Fall MeetingAbstracts,2011,1:1627.
[20]KenleyCR.Influence DiagramModels with Continuous Variables[D].US,CA:Stanford University,1986.
[21]Shachter R D,KenleyCR.Gaussian Influence Diagrams[J].Management Science,1989,35(5):527-550.
[22]Castillo E,Gutierrez J M,Hadi A S.Expert Systems and Probabilistic Network Models[J].Computational Statistics and Data Analysis,1997,2(25):244-245.
[23]Heckerman D,Geiger D,Chickering D M.Learning Bayesian Networks:The Combination of Knowledge and Statistical Data[J].Machine learning,1995,20(3):197-243.
[24]Le Cam L.Maximum Likelihood:An Introduction[J].International Statistical Review/Revue Internationale de Statistique,1990: 153-171.
[25]HaffLR.Empirical Bayes Estimation ofthe Multivariate Normal Covariance Matrix[J].The Annals ofStatistics,1980:586-597.
[26]Cooper G F.A Simple Constraint-Based Algorithm for Efficiently Mining Observational Databases for Causal Relationships[J].Data Miningand Knowledge Discovery,1997,1(2):203-224.
[27]Dobeck G J.A Probabilistic Model for Score-Based Algorithm Fusion[C]//OCEANS,2005.Proceedings of MTS/IEEE.2005,3: 2429-2434.
[28]Wong M L,Leung K S.An Efficient Data Mining Method for Learning Bayesian Networks Using an Evolutionary Algorithm-Based Hybrid Approach[J].EvolutionaryComputation,IEEE Transactions on,2004,8(4):378-404.
[29]Scutari M.LearningBayesian Networks with the Bnlearn R Package[J].Journal ofStatistical Software,2010,35(3):1-22.
Study on the Sea Surface Salinity Model Based on SMOS Data
ZHAO Hong,WANG Cheng-jie
School of Mathematical Sciences,Ocean University of China,Qingdao 266100,Shandong Province,China
Sea surface salinity(SSS)is a key parameter for studying the effects of the ocean on global climate and ocean circulation,and satellite remote sensing detection functions as the most effective means to obtain SSS data.Currently,L-band SMOS and Aquarius/SAC-D satellites are being used to detect SSS based on observing data and the physical mechanism.However,in some near-shore areas,due to the inflow of freshwater and terrestrial radio frequency interference,the precision of salinity satellite products is relatively low.This paper uses the measured data from the"Dong Fang Hong 2"scientific expedition ship and SMOS data to predict SSS by the Bayesian network model for the first time in the South China Sea,and assesses the model with validation data sets(measured Argo salinity).Analysis results show that the model error and validation error is 0.47 psu and 0.45 psu,respectively,while the precision of SMOS Level 2 products is 1.90 psu and 1.82 psu,respectively.This model provides a new method to predict SSS.
sea surface salinity(SSS);SMOS satellite;Bayesian network;statistical model
10.3969/j.issn.1003-2029.2016.01.002
P731.1;TP79
A
1003-2029(2016)01-0015-08
2015-09-08
中央高校基本科研業務費資助項目(201362031);山東省自然科學基金資助項目(ZR2015AQ004)
趙紅(1981-),女,碩士,講師,主要從事貝葉斯網絡模型、衛星遙感與應用研究。E-mail:zhaohong@ouc.edu.cn