原 帥,翟 墨
(佳木斯氣象衛星地面站,黑龍江佳木斯154007)
多普勒天氣雷達原始數據的預處理方法研究
原帥,翟墨
(佳木斯氣象衛星地面站,黑龍江佳木斯154007)
本文利用K-鄰域頻數法對多普勒天氣雷達原始速度資料進行預處理,分析了統計窗口、剔噪聲閾值與補值閾值等參數的選取、算法處理次數等對處理結果的影響,并且對該方法的優點和局限性進行討論,將算法進一步補充完善,使K-鄰域頻數法的補測效果更加有效,以滿足數據預處理的需要。
多普勒天氣雷達;徑向速度;K-鄰域頻數法;資料預處理
雷達在進行實時采樣時會產生一些在空間上分布不連續、無規則且速度值呈跳變現象的噪聲,因此對于原始數據的預處理分析,如何在保留有效速度信息的同時盡可能多地剔除疊加在數據上的噪聲、補足缺測的原始數據點是非常必要的。補缺測點簡單常用方法是插值法、中值濾波法等,例如,胡明寶等[1]采用拉格朗日插值公式補缺測點。周建芬等[2]利用變分原理消除雷達徑向速度資料中的小尺度運動和“噪聲”。王俊、梁海河等[3-4]提出了一種統計意義明確、可以有效剔除孤立奇異點的方法--K-鄰域頻數法,并且以此為基礎提出了“雙徑向-雙切向”退模糊技術。
奇異點的一個明顯特點是較孤立,即以一個點或若干點出現,很少以一大片點出現,在雷達圖上很難用肉眼觀察到。K-鄰域頻數法可以有效解決風場中奇異點噪聲帶來的影響。本文利用K-鄰域頻數法處理多普勒天氣雷達原始數據,對原方法進行補充完善,總結出該方法的優點與缺陷,使之達到最佳的補測效果,提高體掃數據中徑向速度數據的質量,為后續的二維或三維風場反演提供保證。
將±Nyquist速度范圍分成不同的P個等距區間Np(p=1,2,…,P),區間間隔為Δd,另外窗口中心點的值Vij±Δd/2列為第P+1個區間N′,然后統計在M×N窗口內的點分布在不同區間出現的頻數χp(p=1,2,…,P)和χ′,令χmax是χp(p=0,1,2,…,P)、χ′中的最大值,取所對應的區間的中點值為Vp,那么,窗口中心點新值Vij′可以表示為:

式中,k1是剔噪聲閾值,k2是補值閾值,“0”代表無回波。
本文實例所處理的是云南昆明CINRAD-CC多普勒天氣雷達2010年7月的體掃速度資料。
3.1利用K-鄰域頻數法剔除“噪聲”點和補測效果
(1)K-鄰域頻數法對原始速度數據中的孤立點、孤立小區域和連續區域中的奇異點可以做很好的剔除。但是對于奇異點較多的區域,由于被剔除的點數較多,可能會對補值造成一定影響,降低原始資料的質量。同時,K-鄰域頻數法對于原始速度數據中的缺測點、部分缺測小區域作很好的填補。但是對于孤立點較少,缺測點相對較多的區域,在所補測的點可能會減少,效果不太理想。
(2)算法執行次數對效果的影響。通過對大量原始資料處理和對比,發現算法連續處理兩次的效果較好。原因是處理一次時,部分奇異點以及出現頻數較小的點同時被剔除,算法執行兩次后,將第一次處理后的速度作為重新處理的對象,這樣可以對部分剔除的點進行補值,使處理效果更佳。當算法執行三次以上時,處理效果增加不明顯,而且執行速度較慢。因此,將算法執行兩次作為處理的最佳效果。
3.2參數P、M、N、k1、k2對處理結果的影響與對比分析
由原理和反復的試驗對比分析可知,“K-鄰域頻數法”的處理結果與參數P、M、M、k1和k2有關。P與Nyquist值相關,經試驗整數P在數值上約取VN大小合適。如果窗口M×N取得太大,對原數據的保留過少;窗口太小,不同區間出現的頻數很小,影響補測的最終效果。隨著M、N值的增大,剔除奇異點和補缺測點的個數不斷減小,但M、N不能取的太小,否則剔除的速度點過多,對原始數據保留的不夠好。
k1和k2的大小決定于M、N的取值,一般不應小于平均值χ=(M×N)/P,試驗表明k1和k2應大于k1是噪聲閾值,如果偏大會產生誤剔除。k2是補值閾值,可通過調整k2實現不同的補測效果。k2越小,填補點越多,反之填補點減少。
表1是昆明CINRAD-CC雷達2010年7月19日和2010年7月23日體掃資料取不同大小的統計窗口時可填補的最大缺測數。結果表明,在補缺測點時存在最大缺測點數,由于最大補測點數目較少,因此在實際應用中可以填補全部滿足條件的點,而不必擔心影響整體結構。此外,隨著M、N的不斷增大,最大補測點數逐漸減小。可見,統計窗口對補測效果有一定影響,窗口不能取的太大,會影響補測效果。

表1 統計窗口的大小與可填補的最大缺測點數之間的關系,第一層統計數據
由表1可以看出,當統計窗口大小不變時,隨著k1的增大,孤立點數不斷增多。去除孤立點時,應仔細選擇統計窗口的大小,然后選擇合適的k1。原始體掃資料的質量對于k1的取值有重要影響。
在體掃過程中CINRAD-CC型雷達在不同的掃描仰角具有相同的Nyquist速度。所以,在處理過程中,取固定的M、N是可以的。而對于其他某些多普勒天氣雷達,如714SDN型多普勒天氣雷達,在不同仰角具有不同的Nyquist速度,因此在實際處理過程中應選取不同的統計窗口。這是因為,如果統計窗口大小固定,則平均數χ對不同的層就有很大的差別,在補測時應采用不同的窗口大小以及k1、k2值,從而達到預期的效果。
3.3算法優缺點討論
在實際應用過程中,K-鄰域頻數法存在著某些缺陷與不足。當“噪聲”點較多或為一小部分區域時,由于算法所依據的窗口內的點很有可能也是“噪聲”,被剔除的速度點過多,導致在算法執行第二次時補值的點數較少,即無回波的點增加,不能保證數據的完整性。
(1)利用K-鄰域頻數法剔除孤立點噪聲時,統計窗口M、N的取值和剔噪聲閾值k1的選取對結果有重要影響。當M、N的大小為固定值時,應選取合適的k1值,以達到最佳補測效果。(2)由試驗結果可看出,補缺測值時,在M、N一定的情況下,存在最大可補測點數,且所占總數比例甚微。另外,隨著M、N的不斷增大,最大可補測點數減少,但減小的幅度不大,因此在補缺測點時,補值閾值k2要盡可能小,從而使填補的點數增多,不會影響整體數據結構。(3)本文使用了CINRAD-CC多普勒天氣雷達的速度資料,在體掃過程中CINRAD-CC型雷達在不同的掃描仰角具有相同的Nyquist速度,在處理過程中可采用固定的統計窗口。而對于其他某些多普勒天氣雷達,在不同仰角具有不同的Nyquist速度,在實際處理過程中應采用不同的統計窗口。(4)K-鄰域頻數法對于回波區內孤立點的剔除和補測效果很好,而對于較大面積上的缺測點,補測效果存在一定的缺陷。
[1]胡明寶,高太長,湯達章.多普勒天氣雷達資料分析與應用[M].北京:解放軍出版社,2000.
[2]周建芬,周文賢,曾西平.多普勒雷達徑向速度資料的預處理方法[J].南京氣象學院學報,1994,17(2): 213~218.
[3]王俊.利用K-鄰域頻數法處理多普勒雷達原始資料[J].氣象,2005,31(6):51-54.
[4]梁海河,張沛源,葛潤生.多普勒天氣雷達風場退模糊方法的研究[J].應用氣象學報,2002,13(5):591-599.
1002-252X(2016)03-0023-02
2016-6-1
原帥(1987-),女,黑龍江省佳木斯市人,成都信息工程大學,本科生,助理工程師.