蔣金利 諸雪征 顧 進 韓朝帥,2 馬 巖,3 李廣峰
(1.陸軍防化學院 北京 102205)(2.軍事科學院防化研究院 北京 102205)(3.武警四川總隊機動第二支隊 康定 626000)
數據同化算法是一種最初來源于數值天氣預報,為其提供初始場的數據處理技術,現已廣泛應用于大氣海洋領域。在積分描寫動力系統演變過程的數學模式的同時,不斷吸收觀測資料,給出系統狀況的整體估計,且觀測資料僅僅通過少量的觀測站便可獲取,大大降低經濟成本,并有效提高了數值天氣預報的準確度與可靠性。
國外早在1922年,Richadson就首次將同化的思想用于數值天氣預報的主觀分析中[1]。當時他將觀測數據以手工的方式插值到網格點,以此作為預報的初始場,因為方式過于簡單,未做其他誤差處理,導致最后預報失敗。我國在該領域最早的研究是1958年顧震潮學者提出數值天氣預報不是簡單的初值問題[2]。20世紀60年代我國著名氣象學家丑紀范創造性地提出將變分法和泛函分析引入數值天氣預報領域,該理論比國外同行的研究早了近十年。
目前主流的數據同化算法主要分為兩類(按照算法與模型之間的關聯機制分類):
1)以卡爾曼濾波、集合卡爾曼濾波等算法為代表的順序數據同化算法。
2)以三維變分、四維變分等算法為代表的連續數據同化算法。
其中,自從20世紀90年代以來,隨著計算機性能的大幅度提升,變分同化算法在實際應用中得到快速發展,尤其是在數值天氣預報領域,已經被國際上多個業務中心作為業務算法進行使用[3]。中國國家氣象局[4],美國國家大氣研究中心[5~6],英國國家天氣預報中心[7]以及歐洲中尺度天氣預報中心[8]都將變分同化算法作為核心業務算法實現了業務化。在數值天氣預報領域的成功實踐證明了變分同化算法的可行性和正確性。目前同化算法除了氣象領域之外,在海洋[9~11],大氣污染物預測[12~15],地質土壤[16~18]等領域都得到了較大的發展。
假設n維向量xt表示某一物質擴散的真實狀態,n維向量xb表示背景場狀態,m維向量y表示觀測向量,H表示觀測算子,是觀測值與真實狀態之間的紐帶函數。同時,我們用εb表示背景場的誤差,εo表示觀測場的誤差,那么我們便可以得到:

假設誤差準確,且估計無偏,那么εb、εo的數學期望為0,則背景誤差協方差矩陣為

觀測誤差協方差矩陣為

在數據同化中,我們一般認為背景與觀測是兩個相互獨立的事件。假設Pb(x)表示背景場的概率分布,Po(x)表示觀測值的概率分布,且兩者相互獨立,那么這兩個概率分布的乘積就是它們的聯合概率密度函數,也就是我們所求分析場的概率分布,即:

根據最大似然估計原理,極大似然估計值就是使Pa(x)取得最大值時的變量值,也就是所求的分析值。在實際應用中,如果不知道實際的氣象條件,擴散狀態,一般假設為各向同性,其概率則要服從高斯分布,概率密度函數也應為高斯函數,則:

兩者的概率密度相乘,便可以得到分析值的概率密度函數。由于我們所要求的是使聯合概率密度函數取極大值時的函數值,并不是為了去極大值。所以,一般來說,為了簡單計算,我們一把將聯合概率密度函數取對數值。同時,消去負號,使求極大值問題轉變為求極小值問題,也是簡便計算的常用方法之一。以此為基礎,構造出的目標函數為

上式的含義是表示分析場與背景場的距離以及分析場與觀測場的距離。該函數的值越小,說明距離越小,說明分析值與觀測值之間的“距離”越小。
式中:x表示分析值,xb為背景場,B為背景誤差協方差,R為觀測誤差協方差,y為觀測值,H為觀測算子。
誤差是整個同化過程中不可避免的。數學角度看,可以把同化過程理解為最小化誤差的過程。誤差在同化開始前主要體現在背景誤差協方差矩陣B上。由于實際的操作過程中,不管是所設定的背景場數據,亦或是由各種型號的偵察裝備所得到的觀測場數據,甚至是模型本身都不是絕對準確的,都是有誤差的。但是由于很難確定“真值”xtrue到底是多少,就無法得知背景誤差和觀測誤差到底是多少。同時當誤差一直存在于同化的整個過程中時,整個分析過程都是帶有誤差的,這個分析誤差是上述三種誤差在同化過程中相互作用的結果。
一般情況,誤差協方差矩陣假設觀測誤差與背景誤差不相關,即:

式中:εb為背景誤差;εo為觀測誤差,T為矩陣轉置。
在實際分析中,這也是完全合理的假設,背景場參量與觀測場參量相互獨立。
背景誤差協方差矩陣表示預報誤差的概率分布函數,是一個高斯型的函數分布。同化系統所產生的分析場參量大概只有15%來自觀測資料,而剩余的85%均來自背景場[19]。在物理意義上,背景場是同化前該地域的狀態場,它將同化循環中的觀測數據不斷融合進最新的分析場。
背景誤差協方差矩陣在同化中具有很重要的作用:首先它具有信息傳遞的作用,尤其是在觀測資料短缺的地區,分析增量的形狀幾乎完全由協方差決定,矩陣的相關性決定了從觀測點到周圍空間的信息傳播;其次具有信息平滑的作用,在觀測資料稠密地區,它的相關性也決定了信息的平滑程度;它還能體現各個參量之間的平衡關系,比如高度位勢和風場之間的平衡。
與卡爾曼濾波數據同化方法[20~21]不同的是,變分法理論上并不能很好地處理背景誤差協方差矩陣B,因此背景項的設立就顯得尤為重要[22~23]。
變分公式中的B是這樣定義的:

式中xtrue代表真值,εb為背景誤差,很多時候B矩陣也表示為

不難看出,B矩陣是正定對稱矩陣,而且特征值均為非負值。
假設背景誤差為向量(e1,e2,e3),其背景誤差協方差矩陣可寫成:

觀測誤差協方差矩陣包含關于觀測誤差的統計信息。對觀測系統來說,不同位置上的觀測誤差在統計上是相互獨立的。觀測誤差一般包括觀測算子、儀器和代表性誤差。
觀測算子誤差主要是因為對兩種不同種類的數據之間聯系的理解不足導致,主要出現在非直接觀測中。
代表性誤差一般來源于兩方面:一是模型不完美,得不到完全準確的測量;二是有限的模型分辨率,這類誤差的減小可以利用高密度觀測,提高模式分辨率。
儀器誤差是出廠時帶有的,一般會帶有數據參數,考慮設備老化等實際情況可以對參數進行適當調整。除此之外,也鮮有好的解決辦法。
一般而言,對R的處理較簡化,在觀測之間相互獨立情況下,將其簡化為對角矩陣,方便計算。
在變分同化模塊中,同化質量受到多種不同因素的影響,其本身各類參數的影響最大。在上一節的基礎上,通過數據模擬方法[24]分析背景場參量和觀測場參量對同化質量的影響。
簡單起見,在同一高度層進行仿真試驗,只考慮同一種化學物質一個平面層內的連續擴散,不考慮不同觀測設備所獲取的數據格式的不統一,簡化觀測算子為單位矩陣或單位向量。
設定統一的試驗先驗條件:界定危害區域為10km×10km,風向為0°,風速固定為3m/s,大氣穩定度為D級,擴散參數以GB/T為準,迭代次數1000次。假定同化窗口0時刻為擴散發生4小時之后,以模型首次預報值加上隨機誤差生成背景場,以模型后續預報值作為真值,將預報值加上20%隨機誤差生成觀測值。
保證以上條件不變,設定觀測均方差為1,選取算法為四維變分數據同化算法,簡單分析背景場對同化結果的影響。
首次試驗,設定初始背景協方差矩陣為二維單位矩陣,同化結果走勢如圖1所示。

圖1 首次試驗同化結果圖

圖中可以看出,在20次迭代的時候,分析值明顯比觀測值和背景值更加接近真值,起到同化效果。隨著迭代次數的不斷增多,各條曲線間的差異便不是那么容易可以看出來了。在200次迭代的同化圖中,不難看出,基本已經達到了同化效果,并且具有收斂性。這與圖2的誤差以及方差走勢圖也是相一致的。

圖2 首次同化誤差變化圖
從圖中可以明顯看出在200次迭代后,誤差及方差基本收斂。
第二次試驗,調整初始背景場誤差系數,設置為首次的0.5倍大小,再次進行數值模擬試驗。結果如圖3所示。

圖3 第二次背景參數影響分析試驗
從第二次的試驗結果可以看出,背景初始誤差的變化會導致同化精度提高,但是并不影響同化的誤差以及方差的收斂性。
第三次試驗,調整背景場誤差系數,設置為首次的0.2倍大小,再次進行數值模擬試驗。結果如圖4所示。

圖4 第三次背景誤差系數影響分析試驗
從第三次試驗的同化結果可以看出,背景誤差系數的改變會影響初始同化的精度,但是不會影響同化過程的收斂性。
圖5是三次背景場參數試驗同化效果對比圖。

由圖5可以看出,改變初始的背景場誤差系數,會對同化的效果和精度產生影響。當背景誤差系數減小的時候,同化精度會有提高。

圖5 背景誤差系數分析試驗對比圖
但是,從以上三次試驗分析來看,背景場誤差系數對同化結果造成影響的同時,并不會影響整個同化窗口內的收斂性,三次試驗基本都在200次迭代之后開始收斂。
保持初始設置條件不變,選取算法為三維變分同化算法,設置B為對角矩陣,對角線元素為誤差方差,設定其為固定值0.4。這次試驗分析同化后的兩個小時內的同化情況。
由于觀測誤差協方差矩陣R為對角陣,首次試驗設定觀測誤差均方差為0.1。
試驗結果如圖6所示。

圖6 首次觀測參數影響分析試驗
從首次試驗的結果來看,由于背景誤差系數設定為固定數值,所以整體試驗的收斂性較好,基本20次迭代后已成收斂狀態。同時,由于觀測誤差協方差矩陣的性質為對角矩陣,且對角線元素也已經設置,所以觀測場方差的圖形是一條直線。
第二次試驗,保持其他參數不變,上調觀測誤差系數為0.25,結果如圖7所示。

圖7 第二次觀測參數影響分析試驗
就第二次的試驗結果來看,誤差系數加大,同化的穩定性加大,同化的波動加大,但是收斂性并沒有改變。
第三次試驗,保持其他參數不變的基礎上,上調觀測誤差參數為0.30,結果如圖8所示。


圖8 第三次觀測響參數分析試驗
第三次同化的結果來看,同化窗口內波動加大,收斂性不變。
圖9是三次同化效果的對比圖。

圖9 觀測參數分析試驗對比圖
對比來看,觀測參數的變化會影響同化的質量,誤差越大,波動越大,效果越差。同時,參數改變不影響收斂性。
通過對兩種不同的誤差參數的試驗結果來看,背景誤差系數和觀測誤差系數的改變會影響同化的質量,誤差系數越大,同化窗口內的波動越大,效果越差,這也是符合常識認知的;但是,通過對比發現,背景場參數變化對同化的影響程度要高于觀測參數的影響,這也是為什么在實際工作中,認為背景場更加重要的原因;本研究的結果也進一步表明,不管是背景參數還是觀測參數的改變,誤差系數的大小都不影響同化的整體收斂性。