摘要:數據同化是一組統計方法的集合. 在數值模型動態運行過程中,基于數據分布、觀測及背景誤差,數據同化方法能夠融合新觀測數據,提高模型對系統瞬時狀態的估計精度. 當前,數據同化方法已被廣泛應用于地球科學等研究領域. 集合卡爾曼濾波(Ensemble KalmanFilter, EnKF)是一種常用同化方法. 在該方法中,誤差的協方差估計很重要,集合數量過少可能在估計誤差協方差矩陣時產生偽相關問題,導致濾波發散. 協方差局部化方法(CovarianceLocation,CL) 和局部分析(Local Analysis,LA)方法是兩種常見的局部化方法,常被用于解決偽相關問題. 其中,CL 方法不適用于集合變換卡爾曼濾波(Ensemble Transform KalmanFilter, ETKF). 近年來,雖有部分研究將變體形式的CL 方法成功應用于ETKF數據同化,但計算繁瑣. 本文提出了隨機協方差局部化( Random Covariance Location,RCL) 方法, 該方法也適用于ETKF 同化. 本文分析了RCL 方法與LA 方法在處理誤差協方差矩陣、集合變換矩陣等方面的區別,然后將兩種方法分別應用于ETKF,生成兩種同化算法. 本文通過算例對比了各同化算法對不同類型數值模型的同化效果. 結果表明,RCL 方法同樣能解決偽相關問題. 另一方面,對不同的模型類型,兩種同化算法的同化效果各有特點:對線性平流模型,基于RCL 的算法的同化效果略低于基于LA的算法,但魯棒性更強;對非線性3 元Lorenz 模型, 隨觀測誤差的減小,基于RCL 的算法的同化效果優于基于LA的算法,但魯棒性略有降低.
關鍵詞: 數據同化; 集合變換卡爾曼濾波; 協方差局部化; 局部分析
中圖分類號: O224 文獻標志碼: A DOI: 10. 19907/j.0490-6756. 230395
1引言
數據同化方法[1]是一組統計方法的集合. 在地球科學等研究領域數據同化方法有著廣泛應用. 在數值模型動態運行過程中,數據同化方法能夠基于數據分布、觀測值及背景誤差,通過融合新觀測數據來提高數值模型對系統瞬時狀態的估計精度.
集合卡爾曼濾波(Ensemble Kalman Filter,EnKF)是一種典型的數據同化方法. 1994 年,在對海洋數據的同化中EnKF 方法首次被提出[2]. 該方法有效結合了集合預測和卡爾曼濾波[3],通過前向積分結合新觀測數據,得到一組分析集合,并采用卡爾曼濾波方程來實施更新,能夠大幅降低濾波的計算量. 在EnKF 中,誤差協方差矩陣預測集通過統計方法得到,當集合數目過大時計算成本過高;當集合數量太少時則可能出現抽樣不足、預測誤差協方差低估及偽相關問題,導致濾波發散.
為了在集合數目較少時應用EnKF 并提高其同化效果,研究者提出了一些改進方法,如協方差膨脹(Covariance" Inflation, CI)法[4]、協方差局部化(Covariance Location, CL)法[5]及局部分析(LocalAnalysis, LA)法[6]等. CI 方法引入了膨脹因子,并通過它來彌補被低估的預測誤差協方差. 雖然CI方法能克服預測誤差協方差的低估問題,但它并不能解決偽相關性. CL 方法則通過在預測誤差協方差矩陣和局部函數之間運用Schur 乘積[7],同時對預測誤差協方差陣中超過預設距離的觀測數據進行截斷來解決偽相關問題. 最后,LA 方法以待估計狀態變量為中心構建局部區域,并在局部范圍內進行更新,以得到預測誤差協方差的局部近似. 當前,越來越多的研究指向CL 方法和LA方法[8].
雖然CL 方法能夠解決偽相關問題,但它卻不適用于集合變換卡爾曼濾波(Ensemble TransformKalman Filter, ETKF)方法[9],原因在于:CL 方法基于預測誤差協方差矩陣,在ETKF 中無法進行顯式計算,導致其中的Schur 乘積運算無法進行.為解決這個問題,文獻[10]提出了一種適用于ETKF 方法的近似CL 方法. 該方法通過將n × m列零向量(n 表示狀態變量的數量, m 表示集合的數量)添加到預測集合的擾動矩陣中來擴展和修改矩陣,解決矩陣維數不一致的問題. 已有研究表明,該方法僅是一種弱近似、同化效果較差.
增益形式的ETKF(Gain form of EnsembleTransform Kalman Filter, GETKF)方法也是一種改進的ETKF 方法[11]. 該方法成功將CL 方法應用于ETKF,可惜計算復雜度太高[12,13],原因在于其修正預測集合擾動矩陣時所采用方法較為繁瑣.本文提出了一種簡化的協方差局部化( RandomCovariance Location, RCL)方法,用以代替GETKF 方法中使用的CL 方法. 本文比較了RCL方法和LA 方法在處理背景誤差協方差矩陣及集合變換矩陣等方面的差異. 然后,通過將RCL 和LA 方法分別應用于ETKF,本文生成了兩種同化算法. 最后,本文以算例比較了兩種同化算法對不同類型數值模型的處理效果. 后文的安排如下.第2 節介紹了CL方法、LA方法和RCL方法等3 種局部化方法. 第3節介紹算例分析需要的數值模型.第4節進行算例分析. 最后,第5節總結所得結果.
4. 2RCL 法和LA 法對集合變換矩陣的影響
為了研究RCL 法和LA 法對集合變換矩陣T的影響,我們設置觀測誤差的方差R = 10. 當同化時間t = 5 時,RCL 和LA 的集合變換矩陣的比較結果如圖3 所示. 可以看到,RCL 能夠消除遠距離偽相關現象,始終保持對角化. 此外,隨觀測誤差的減少,RCL 方法和LA 方法的集合變換矩陣的差異逐漸增大,后者在局部區域變得松散,說明RCL方法在更新集合擾動方面具有更強魯棒性.
4. 3 RCL 和LA方法對同化算法的影響
為研究RCL 和LA方法對ETKF同化算法的影響,我們分別用線性平流模型和3 元Lorenz模型進行數值實驗. 對線性平流模型,分別設定R = 1和R =0. 001進行兩次實驗,其余設置同前,其中對RCL 方法固定L = 2.實驗結果參見表1 和表2.可以看到,相比傳統ETKF 算法,分別使用RCL 和LA方法的算法都能提高同化效果,使用LA方法的提升更顯著,但時間成本也更大. 此外,與使用LA 方法的同化算法相比,使用RCL 方法的算法更具魯棒性,即便觀測誤差的方差顯著變化算法的性能也保持穩定.
對3 元Lorenz 模型(簡稱L3 模型),分別設定R=1和R=0.001進行兩次實驗,其余設置為p=3,m =2,L =2. 與文獻[9]相同, 我們將模型運行1500個同化周期, 丟棄前500 個周期,取后1000 次循環的平均值作為實驗結果,參見表3 和表4. 可以看到,使用RCL 和LA 方法后,ETKF算法的同化性能均明顯提升,使用LA 方法的算法具有較低的均方根誤差,同化時間則高于其余算法. 此外,隨觀測誤差的降低,各同化算法性能均有提升, 使用RCL 方法的算法具有最好的同化效果,但魯棒性有所降低,原因可能是L3 模型的非線性.
5結論
本文提出了簡化的協方差局部化( RCL)方法,并將其應用于集合變換卡爾曼濾波. 本文對RCL方法和LA方法對背景誤差協方差矩陣和集合變換矩陣的影響進行了比較,并將這兩種局部化方法分別應用于ETKF同化算法,并將這些同化算法分別應用于不同類型的數值模型,通過比較其同化效果來間接比較兩種局部化方法對同化算法的影響. 所得結果如下.
(i)RCL方法可以解決偽相關問題.
(ii)RCL相對LA方法具有更強魯棒性.
(iii)在對同化效果的影響方面,對線性平流模型,LA方法好于RCL 方法,但需要更長時間,且RCL 方法的魯棒性更強. 對3元Lorenz模型,當觀測誤差方差較小時,RCL 方法優于LA方法 ,所需同化時間小于后者,但魯棒性略有損失.