沈王彬 李昕 秦正坤 張冰
1 南京信息工程大學大氣科學學院,南京 210044
2 南京信息工程大學資料同化研究與應用聯合中心,南京 210044
3 南京氣象科技創新研究院/江蘇省氣象科學研究所,南京 210009
大氣邊界層是下墊面與自由大氣進行物質與能量交換的重要場所,在大氣邊界層中時刻進行著諸如湍流動量和熱量交換等過程,一些常見的天氣現象如霧和降水以及一些爆發性氣象災害如暴雨和沙塵暴與邊界層中的物理過程有密切聯系。地表熱力通量和水汽通量通過邊界層上傳自由大氣,影響天氣過程演變。因此,地面觀測資料在天氣預報預警中具有重要作用。
隨著觀測技術的發展,目前我國已經建立了巨大且密集的地面氣象觀測網絡,全國已建成約七萬個自動氣象觀測站,自動氣象觀測站能夠定時、定點的觀測和記錄地面氣象信息,并且能夠在復雜的地形下進行無人觀測(張慧, 2012)。但是自動化氣象觀測事業的發展同時也帶來了些許問題,張穎超等(2017)、徐浩然(2019)指出隨著觀測自動化的實現,原有的業務模式發生改變,但是地面觀測技術的不穩定導致地面觀測資料更容易出現質量問題,一方面眾多臺站的觀測資料往往由于采集、傳輸或儀器自身的系統問題,不可能達到完全正確無誤,另一方面,區域自動站資料的質量控制和評估工作較為滯后,直接影響了資料在預報預測業務中的使用。
為了提高區域自動氣象站觀測的數據質量,需要通過質量控制來保證數據質量(Lorenc and Hammon, 1988)。近十年來,我國氣象工作者在實時觀測資料自動質量控制方面做了大量的研究工作。國內外有關地面氣象資料的常規質量控制方法主要有氣候學界限值檢查、臺站或區域極值檢查、要素間內部一致性檢查、時間一致性檢查以及空間一致性檢查等方法。王海軍等(2007)、陶士偉等(2009)、陳興旺(2011)、趙煜飛等(2011)都利用常規質量控制方法對我國的地面觀測資料進行了質量控制試驗。李良富等(2006)和葉小嶺等(2016)還嘗試了利用人工智能的黑板模型和基因表達式編程方法進行了質量控制。基于空間分析方法EOF(Empirical Orthogonal Function)分解方法,Qin et al.(2010)和邵宇行等(2021)針對全國高時間和空間分辨率的地面自動站觀測資料,對前人提出的基于EOF 分析的質量控制方法進行適應性的調整,并利用我國中東部的自動站觀測資料進行實際質量控制試驗,發現該方法可以很好適用于高時空分辨率的地面自動站觀測資料。
錯誤的自動站觀測資料會對天氣預報和氣候變化研究帶來嚴重的影響,根據研究目的不同,氣象學家對錯誤資料的處理方法也不盡相同。氣候研究往往是對資料的穩定性提出較高的要求,如何把誤差的大小控制在氣象業務所允許的范圍內,提供一個在時間和空間上更加完整的觀測資料數據集,以確保歷史觀測資料的連續性是自動站觀測資料應用上面臨的問題(王曉春等,1994;江志紅等,2008;曹麗娟和嚴中偉, 2011)。而在資料同化應用中,為了保證同化增量的合理性,往往傾向于直接剔除可疑的觀測資料(薛紀善, 2009),但錯誤資料也并非完全不可利用,在進行有效訂正的前提下,通過對訂正后資料進行合理的、定量化的觀測誤差調整,將使得這些資料在模式中的應用變為可能。
資料序列的訂正方法研究是國內外學者所共同關注的問題之一,并已有不少研究。根據方法的原理不同,目前的錯誤資料或者缺測資料的修復方法大致可以分為以下三類:一是利用觀測資料本身的規律或者不同氣象變量之間的物理關系來進行資料修復,多用于氣候資料(Annan and Hargreaves,2013; 李天祺等, 2015; 周芳成等, 2021),或者規律性 顯 著 的 資 料(G?ttsche and Olesen et al., 2001;Duan et al., 2012);二是利用隨機模型方法,利用擾動的隨機樣本之間的相似性來修復數據,比如神經網絡方法(Wu et al., 2019)、自組織映射法和期 望 最 大 化 法 等(Sorjamaa and Lendasse, 2007;Zhao et al., 2020);三是根據變量的時空特征,利用最優化和多維統計方法來修復資料,比如最優插值方法(朱江等, 1995; Everson et al., 1997)、經驗正交函數(EOF)分解方法(Alvera-Azcárate et al.,2009; 盛崢等, 2009; Shen et al., 2019)。
同時,研究也發現沒有絕對最優的空間內插方法,必須對所研究的數據進行空間探索分析,根據數據的特點,選擇相應方法,對某一種氣象要素合適的插值方法未必對另一種氣象要素合適(蔡彥楓等, 2015)。我國目前已經建成了近七萬個地面自動觀測站,高時空分辨率的地面自動站資料最大的特征就是小尺度特征強,時空變率大,容易出現極值情況,尤其是對于天氣變化尺度的研究,僅依賴于溫度的日變化等變量固有的規律性特征進行修復容易出現較大的誤差,而較多的極值情況也導致了基于隨機性的修復方法存在一定的不足,所以依賴于周邊資料來修復地面站溫度資料是一種比較可行的方法。
最優化和多維分析方法都可以依據周邊資料來修復單個錯誤資料,但是最優化方法往往需要資料的誤差等先驗信息,所以基于EOF 等多維分析方法的錯誤資料修復方法就成為更為簡單易行的方法。基于EOF 分析的時空分離的特征,Alvera-Azcárate et al.(2009)和Shen et al.(2019)都提出了基于EOF 空間分析方法的錯誤資料修復方法。EOF 方法的優點在于利用空間降維技術將原始變量場的時空結構進行正交分解,得到為數很少的不相關典型模態來代替原始變量場。EOF 方法提取的典型模態存在兩個重要特征,一是模態是在考慮了變量場時間和空間變化特征后確定的,不容易受到少數極值資料的影響,這種特征對于提取小尺度信號強的地表信息時尤為重要;二是EOF 方法提取的各個模態是相互正交的,各個模態及其對應的系數在處理過程中不會相互影響,所以可以考慮通過迭代的方法逐步確定各個模態的系數,不需要考慮不同模態系數之間的相互影響。利用EOF 分析方法的這兩個特征,我們就可以建立一個基于迭代的錯誤資料修復方法。首先利用EOF 分析方法將研究區域的大氣溫度分離為不同尺度的空間模態,然后分別針對代表不同時空尺度的EOF 模態,通過迭代的方法消除錯誤資料對EOF 分析模態的影響。由于個別錯誤資料不會影響各個模態所對應的時間系數,結合迭代修正的EOF 分析模態和穩定的時間系數,我們就可以具有很好的時空連續性的修復結果。
本文將針對全國自動氣象站觀測資料高時空分辨率的特征,在有效識別自動氣象站異常觀測資料的基礎上,利用EOF 分析方法,建立一個新的基于EOF 迭代方法的錯誤資料修復方法,并對中國東部自動站氣溫觀測資料進行了錯誤觀測資料的修復試驗,希望為自動氣象站錯誤觀測數據的修復提供科學依據。
本文選取的資料為江蘇省氣象局通過全國綜合氣象信息共享平臺CIMISS(China Integrated Meteorological Information Service System)數據庫實時接收的2019 年12 月1 日00:00 至7 日23:00(北京時,下同)的逐小時地面自動站觀測資料,共168 個時次的地面觀測站溫度觀測資料。選取的研究區域為(29°N~39°N,113°E~123°E)。高水平分辨率是自動站觀測資料的主要特點,圖1 給出了自動站站點的空間分布特征,其中站點分布最密的主要是在江蘇、山東和安徽三個省份。

圖1 地面自動觀測站點(黑色點)水平空間分布Fig.1 Spatial distribution of ground automatic observation stations(black points)
由于觀測資料中存在大量缺測資料,為了保證研究結果的普遍性,我們需要對某些時刻缺測值進行時間三次樣條插值,但是由于某些站缺測時刻過多導致時間插值后存在極端異常值。所以為了盡可能的消除時間插值對檢測結果的影響,我們首先對觀測資料進行篩選;篩選的條件有:(1)前五個時次無缺測,(2)后五個時刻無缺測以及(3)168 個時次至少有1/10 資料無缺測;最終該區域包含4983 個觀測站。
對自動氣象站氣溫觀測資料進行質量控制,準確的識別出其中錯誤的資料是修復錯誤資料的前提。為此,邵宇行等人(2021)提出了基于EOF 的高時空分辨率自動站溫度觀測資料質量控制方法。按照該方法首先利用傳統質量控制方法對資料進行了預處理,去除了數據中明顯存在的誤差。在此基礎上,以ECWMF(European Center for Medium-Range Weather Forecasts)的ERA5 2 m 溫度再分析資料作為背景場信息,使用EOF 質量控制方法對篩選出的4983 個站點進行了質量控制。
圖2 給出了基于該質量控制方法識別出的168個時次的錯誤資料個數曲線。平均剔除資料為每日48 個,剔除率約為0.96%,大部分時間錯誤資料量都是穩定在50 個左右,只是在第136 時次和第146 時次錯誤資料個數異常偏多。

圖2 2019 年12 月1~7 日質量控制方法剔除資料量的時間變化曲線Fig.2 Hourly data count of abnormal data detected by the quality control method during December 1–7, 2019
為了明確剔除資料的正確性,圖3 給出了2019 年12 月1 日11:00 四個離群觀測站點及其周圍站點的氣溫分布情況,黑色陰影表示地形高度。該時次一共識別出89 個離群站點,主要分布在安徽省的中部及南部。根據四個錯誤站點以及周圍站點的溫度分布可以看出,錯誤站點在第36 個時次相較于周圍站點觀測溫度均為異常高值,因此可以認定基于EOF 的質量控制方法識別的錯誤資料是合理的。雖然質量控制方法能夠剔除絕大部分溫度異常的站點,但是依然可能存在漏檢現象,圖3 中的區域中部(30.72°N,116.45°E)可以看到存在一個明顯低于周邊站點溫度的資料,這可能還需要更長時間的資料來評估研究區域地面溫度的空間連續性特征,后續研究中我們將引入更長時間資料來完善目前的質量控制方法。

圖3 2019 年12 月1 日11:00(第36 時 次)局部溫度數 值(單位:°C)。圖中陰影表示地形高度(單位:m),紅色為剔除站點Fig.3 Spatial distribution of the observed temperature (units: °C) at 1100 BJT (Beijing time) December 1, 2019 (36th hour). The shading indicates the terrain (units: m) and the red dots represent the abnormal stations
從錯誤站點的識別結果可以看出,自動站觀測資料在每個時刻均存在50 個左右的錯誤資料,在數值天氣預報需求日益精細化的背景下,錯誤資料會對天氣預報帶來很多消極的影響。因此,在對錯誤站點進行準確識別的基礎上,本研究的主要的目的是對錯誤氣溫資料進行準確的修復。
在利用前期質量控制方法有效識別錯誤的氣溫觀測資料基礎上,我們將嘗試對錯誤資料進行修復研究。為了不失一般性,我們將嘗試修復其中任選的一個錯誤觀測站s的氣溫觀測資料。
高時空分辨率的地面自動站溫度觀測資料也具有時空變率強的特點,所以基于變量規律性特征或相似樣本的修復方法存在一定的不足,因此利用周邊觀測信息修復某個站點的錯誤資料最為可行。基于最優插值方法和基于多維分析方法的修復方法是最常用的基于周邊觀測信息修復單個觀測資料的方法。這里我們分別選用了兩類修復方法,一是基于Cressman 空間插值方法的修復方法,二是利用Shen et al.(2019)建立的基于EOF 分析方法的迭代修復方法。
2.3.1 基于Cressman 空間插值修復方法
Cressman 插值方法是一種比較經典的非規則格點空間插值方法(Cressman, 1959),該方法的基本原理是基于相鄰越近的站點在空間分布上具有越相近特征的假設,由于地面自動站高空間分辨率的特點,因此利用錯誤站點周圍正確的氣溫觀測資料,通過空間插值方法可以獲得該點的觀測信息。該方法的基本形式如下:

其中,fi是第i個需要被修復的觀測站點的氣溫值,W(Di)是Cressman 權重系數,其形式為

式中,R為影響半徑,這里經驗的設定為0.75°,Di為錯誤站點與周圍正確觀測站點的距離。由權重函數可以看出,距離被修復的點越近的點權重函數越大,符合Cressman 插值基本原理。
2.3.2 基于EOF 迭代修復方法
基于EOF 的迭代修復方法首先是建立用于EOF 分析的數據矩陣。假定地面站s點被檢測為錯誤觀測站,再選取空間內所有觀測站的觀測資料,剔除其中已經檢測的所有錯誤氣溫觀測資料,剩余觀測站數記為n。考慮到地面溫度的日變化,對于已選的n個觀測點,選擇每個觀測點上當日連續24 個時次的逐小時觀測數據,假定修復某觀測站第12 時次的氣溫觀測資料,那么這里的24 個時次選為:當日00:00~23:00 連續24 個時次的觀測氣溫,記為Ti, j,其中i=1,2,···,24 表示一共選取24個時次的觀測資料,j=n表示一共選取n個站點進行重構。
最終用于修復的數據矩陣可以表示為Am×n:

其中,m=24,代表所選的24 個時次,假設其中第x個時次,第s觀測點Tx,s為錯誤資料,也是用于重構的觀測點。為了增強錯誤資料與其周邊資料點之間的小尺度異常特征,可以設Tx,s=0。對上述矩陣A進行EOF 分解,我們可以得到:

式中,Vk一般稱為模態向量,而Zk則是系數向量,k代表第k個模態,因為所選的觀測站數肯定是大于時次數,所以EOF 分析獲得的模態數最多為m個。
由于EOF 第一模態提取的是資料的平均特征,所以有理由認為第一模態不會包含異常點0 值的信息,那么利用第一模態進行重構就可以得到:

獲得準確的第一模態信息是保證方法修復效果的前提條件。雖然0 值的異常信息不會被包含到第一模態中,但是0 值仍然可能使得應有的第一模態信息被分散到其他模態中。因此需要通過迭代的方式逐步完善第一模態所代表的平均特征。
在獲得Tx1,s后,我們將該值帶入到原來的數據矩陣,組成新的數據矩陣A1,即:

對矩陣A1再次進行EOF 分解可得:

同樣獲得基于第一模態重構獲得的s點氣溫,即:





圖4 2019年12月4日00:00~23:00(a)用來重構的氣溫分布(單位:°C)以及(b)隨迭代次數的變化曲線Fig.4 (a) Spatial distribution of temperature (units: °C) for reconstruction and (b) variation of with the number of iterations for station s from 0000 BJT to 2300 BJT on December 4,2019
實現了第x個時次s點氣溫第一模態特征完全再現的基礎上,我們繼續提取第二模態的信息。經過t1次迭代后,構造的新的數據矩陣為At1為

對矩陣At1進行EOF 分解,并利用前兩個模態重構s點地面溫度:

從前面的分析可以知道,我們已經獲得了Tx,s穩定的第一模態信息,并構造了新的數據矩陣,這等同于將除第1 模態外的其他模態分量設為0,簡單的重復上述迭代過程,我們可以獲得具有前兩個模態準確信息的T。同樣通過對更多模態進行上述迭代過程,我們可以依據EOF 提供的周邊觀測點信息和其它未受干擾的通道觀測信息的約束條件下,獲取包含盡可能多正確觀測信息。
理論上可以對所有模態進行提取,所以圖5 也給出了不同模態迭代過程中誤差的變化曲線,圖中不同顏色分別代表不同的模態。可以看到,前七個主要模態迭代結束后,重構值趨于穩定,此時誤差在0.5°C 左右。繼續對剩余的模態進行提取,可以

圖5 重構過程中觀測值與重構值的差隨迭代次數的變化曲線(單位:°C)。不同顏色分別代表不同的模態Fig.5 Temperature differences between the observed and the reconstructed temperature varying with the number of iterations (units: °C). Different colors represent different modes
看到,由于剩余模態包含一些小尺度的氣溫場信息,因此重構誤差曲線出現了一些波動,但是當所有模態均被提取后,重構誤差小于0.1°C。
在新的修復方法適用之前,應該對該方法的修復精度進行評估。首先選取單個時刻的氣溫觀測資料中的正確資料作為驗證數據。圖6 給出了2019年12 月4 日14:00(第87 個時次)用EOF 質量控制方法識別出的錯誤站點的分布。可以看到,該時次一共出現19 個錯誤站點。

圖6 2019 年12 月4 日14:00(第87 個時次)EOF 質量控制方法識別出的錯誤站點(紅色圓點)分布Fig.6 Spatial distribution of abnormal data (red points) at 1400 BJT December 4, 2019 (87th hour)
對該時刻所有正確資料逐個進行重構,將重構結果與觀測進行對比,并統計其均方根誤差可以有效的驗證重構方法的精度。均方根誤差的計算公式如下:

其中,n表示選取的站點數,T為站點的觀測氣?溫值,T為重構得到的站點氣溫。若均方根誤差越小,則表明重構結果精度更高。
圖7 給出了2019 年12 月4 日14:00(第87 個時次)正確觀測氣溫、兩種方法重構的氣溫分布以及觀測與重構的誤差(觀測減去重構)。從自動站正確觀測資料的分布可以看到,自動站空間分辨率較高,因此能很好分辨更多小尺度的溫度變化特征。空間分布形態也是評價插值方法的重要方面,對比基于EOF 迭代法和Cressman 插值法得到的氣溫分布,可以看到,EOF 迭代法重構的氣溫與觀測非常接近,重構場不僅能準確的描述氣溫觀測的空間特征,對于觀測中存在的一些極值也能很好的還原,這是由于EOF 方法考慮了變量場時間和空間變化特征,不容易受到少數極值資料的干擾,也不易受觀測站點分布的疏密程度和不均勻性的影響。而Cressman 插值法得到的重構場只能大致反映觀測氣溫的特征,但是在極值和極值附近區域重構值與觀測存在較大差異,原因是Cressman 方法只考慮周圍站點的距離來確定其權重, 而不考慮它們之間的空間相關性,即是站點距離越近則變量值越大,分析值就越靠近,從而在極值及其附近區域出現偏向的特征。統計結果表明EOF 迭代法的重構均方根誤差為0.41°C,而Cressman 插值的重構均方根誤差為1.25°C,遠大于EOF 迭代法,從重構誤差的分布上可以看到,EOF 迭代法的重構誤差基本在0.5°C 以內,并且誤差的分布比較隨機,與氣溫本身高低無關。Cressman 插值重構的誤差較高,尤其在地形變化強烈的區域附近,如安徽省的大別山以及黃山附近。由于地形影響,氣溫在大地形附近出現了較大溫度梯度,但是Cressman 插值僅考慮測站之間的距離,不能結合觀測站之間的空間相關性,因此插值結果誤差較大。

圖7 2019 年12 月4 日14:00(第87 個時次)觀測氣溫、重構氣溫以及誤差(觀測減去重構)的分布(單位:°C):(a)觀測氣溫;(b)EOF 迭代法重構氣溫;(c)EOF 迭代法重構氣溫的誤差;(d)Cressman 插值法重構得到的氣溫;(e) Cressman 插值法重構氣溫的誤差Fig.7 Spatial distributions (units: °C) of observed and restored temperature and their difference distribution at 1400 BJT December 4, 2019 (87th hour): (a) Observed temperature; (b) restored temperature of EOF method; (c) restoration error of EOF method; (d) reconstructed temperature of Cressman interpolation method; (e) reconstruction error of Cressman interpolation method
為了增大樣本數來提高統計可信度,我們又選擇了2019 年12 月1~7 日 共168 個時次,共計808260 個正確的氣溫觀測,分別使用EOF 迭代法和Cressman 插值法進行重構。經統計,EOF 迭代法和的重構均方根誤差分別為0.48°C 和1.55°C,Cressman 插值的誤差遠大于EOF 迭代法,這與圖7的結論一致。圖8 給出了所有正確觀測氣溫與重構氣溫的散點圖,黑色點表示EOF 迭代法對應的散點,灰色點表示Cressman 插值法對應的散點。可以明確看到,EOF 迭代法重構的氣溫與觀測值較為接近,重構誤差較小,而Cressman 插值法由于受多方面的干擾重構效果較差,重構后的氣溫表現出來的特征不明顯,其誤差明顯大于EOF 迭代法。

圖8 觀測氣溫與EOF 迭代法(黑色點)以及Cressman 插值法重構氣溫(灰色點)散點圖(單位:°C)Fig.8 Scatter plots between the observed and reconstructed temperature of the EOF iteration method (black spots) and the Cressman interpolation method (gray spots), units: °C
進一步分析重構誤差的分布情況,圖9 給出的是觀測值與重構值誤差的概率密度函數分布曲線。可以看到,EOF 迭代法重構誤差分布的峰度系數為210,誤差絕對值基本集中在0.5°C 以內,只有極少數誤差絕對值大于1°C,但是極值也在2°C 以內。而Cressman 插值重構誤差峰度系數為83.67,很大一部分站點的重構誤差大于1°C。因此,相對于Cressman 插值而言,EOF 迭代法具有更高的穩定性和更高的精度。

圖9 EOF 迭代法(藍色實線)以及Cressman 插值(紅色虛線)的重構誤差概率密度曲線(單位:°C)Fig.9 The probability density function of the reconstruction error for the EOF iteration method (blue solid line) and the Cressman interpolation method (red dotted line) during 1–7 December 2019(units: °C)
在根據正確數據對EOF 迭代法的修復精度進行理想評估后,我們將修復方法應用到實際錯誤資料的修復中進行檢驗。分別使用EOF 迭代法和Cressman 插值法對基于EOF 的自動站質量控制方法識別出的錯誤站點進行修復。圖10a 給出了2019 年12 月4 日14:00(第87 個時次)局部溫度數值(紅色為錯誤站點溫度數值),圖中的陰影表示地形高度。兩個站點在第87 時次被判定為離群點,根據兩個站點第87 時次的溫度及其周圍站點溫度分布可以看出,兩個站點在第87 時次相對于周圍站點溫度為異常高值,并且該錯誤站點的地面溫度觀測并未受地形的影響,因此可以認定質量控制方法判定的錯誤資料是合理的。使用兩種方法對該錯誤站點進行重構,圖10b、c 分別給出了基于EOF 迭代法和Cressman 插值法修復的地面氣溫,可以看到,EOF 迭代法重構的氣溫值明顯低于錯誤的觀測氣溫,并且修復值與周圍觀測值更加接近,而Cressman 插值結果與周圍觀測相比則異常偏低,這是由于錯誤站點南部出現了地形高度增加的情況,隨著地形高度的增加地面溫度也出現了明顯的降低,因此區域南部氣溫普遍低于區域北部,由于Cressman 插值只考慮測站空間距離因素,南部的低溫資料會使得最終插值結果偏低。EOF 迭代法則能綜合考慮氣溫的空間典型分布特征,使得重構結果不受地形影響。因此,EOF 迭代法修復后的氣溫分布連續性更佳,其平滑性和規律性更好,修復效果也更好。
重構的氣溫分布已經驗證了修復氣溫在空間分布上的合理性。另一方面,自動氣象站逐小時高分辨率的氣溫觀測資料為精細化研究氣溫的日變化差異、季節及氣候特征帶來了可能性,因此,修復后的氣溫隨時間變化是否合理也是評估修復氣溫質量的一項重要指標。圖11 給出了圖10 中兩個識別出的錯誤站點的觀測以及修復后氣溫的日變化曲線,可以看到,與周圍站觀測氣溫相比,兩個存在錯誤觀測資料的站點均在第15 時次出現了異常偏高的觀測氣溫(紅色線),在該時刻遠高于周圍所有觀測站的氣溫(灰色線)。對北部站點而言,經過EOF 迭代法修復后(藍色線),錯誤站點氣溫的時間變化趨勢與周圍站點基本一致,符合氣溫日變化的規律,而Cressman 插值得到的氣溫(黑色線)在該時刻出現異常偏低的不合理變化趨勢。這是由于EOF 迭代法不僅能考慮到氣溫的典型空間分布特征,同時其在氣溫的時間變化趨勢約束下對錯誤觀測進行重構,最終得到的重構結果能同時滿足氣溫的時空特征,而Cressman 插值結果則受到觀測站南部地形影響,插值結果異常偏低。

圖10 2019 年12 月4 日14:00(第87 個時次)(a)局部觀測氣溫、(b)EOF 迭代法重構氣溫以及(c)Cressman 插值氣溫分布,單位:°C。圖中黑色陰影表示地形高度(單位:m)Fig.10 Spatial distribution of (a) observed temperature, (b) restored temperature by the EOF iteration method and (c) restored temperature by the Cressman interpolation method at 1400 BJT on December 4, 2019 (87th hour), units: °C. The shading indicates the terrain (units: m)

圖11 2019 年12 月4 日10:00~20:00 觀測氣溫(紅色)、重構后氣溫(藍色)、Cressman 插值后(黑色)氣溫以及周圍站點的氣溫(灰色)序列(單位:°C)Fig.11 Time series of (a) observed temperature and (b) restored temperature by the EOF iteration method and (c) restored temperature by the Cressman interpolation method during 1000 BJT–2000 BJT on December 4, 2019 (units: °C)
錯誤的自動站觀測資料對天氣預報和氣候變化研究帶來很大的限制,地面氣候研究以及各個領域需要的專業氣象服務往往需要完整的自動站觀測數據,因此對異常觀測的資料序列進行訂正,確保觀測資料的準確性和連續性至關重要。
本文利用江蘇省氣象局提供的2019 年12 月1日00:00 至7 日23:00,共168 個時次的地面自動站溫度觀測資料,在EOF 的質量控制方法有效識別異常觀測資料的基礎上,提出一種新的基于EOF 的迭代方法用于修復錯誤的自動氣象站地面氣溫觀測。
結果表明,利用本文提出的EOF 迭代修復法可以較高精度的對地面氣溫觀測進行重構,其重構均方根誤差為0.48°C,遠小于Crssman 插值法,并且EOF 迭代法修復后的氣溫在時空特征上都具有合理性。這是因為EOF 迭代法不僅考慮了地面氣溫的典型空間分布,還利用了氣溫隨時間變化的特征對重構進行約束,從而從整體上考慮了插補資料的效果。而Cressman 一類的插值方法只選取了錯誤點周邊的部分資料,通過資料的連續性進行插值,但是其插值過程中不能考慮其他周邊資料的約束,所以容易受到個別極端資料的影響,這對于小尺度信息較強的地表變量來說,更容易出現不穩定現象。
由于資料長度的限制,本文沒有對長時間的氣溫觀測進行修復試驗,在后續的研究中我們將針對更長時間的觀測資料進行重構檢驗。另一方面,目前的工作只針對地面氣溫展開,在以后研究工作中還應考慮利用EOF 迭代法對其他一些地面觀測變量進行修復,例如相對濕度、降水等。