費強 許歡



摘 ? 要:氣象數據的記錄早期都是人工進行觀測并記錄而獲得的。隨著計算機技術的發展、自動化水平的提高,部分氣象觀測站點的氣象數據逐漸開始應用儀器自動記錄氣象觀測數據,如何將雙套站的兩套數據融合成一套數據成為氣象站業務投入前必須解決的問題。文章利用安徽氣象局祁門站由A,B兩套儀器測得的氣溫觀測數據,在對數據進行有效的預處理之后,提出了3種融合數據算法:一是基于空間一致性的主備法;二是基于數據的滑動方差和標準差,對數據賦以不同權重的權重法;三是基于差值訂正的合成法。將其進行分析和評估并比較融合效果,結果表明,3種算法都是合理的,融合值基本可以反映真實的情況。
關鍵詞:氣象;滑動方差;空間一致性;數據融合
1 ? ?我國自動氣象站發展概述
我國是世界上氣候變化較大的地區之一,為了對極端天氣進行提前預防和抵御,中國氣象局大力采取一系列措施,推動和促進大氣監測自動化快速發展[1]。從1999年我國自行研發第一批自動氣象站開始,到現在已有30 000多個自動氣象站,在很大程度上增加了地面氣象觀測資料的時間密度并提高了觀測數據的精確度[2]。隨著氣象科技的發展,雙套自動氣象站建成并已投入使用。雙套自動站的建設工作是在原有自動氣象站的基礎上,再建設一套新型自動氣象觀測設備,從而取消人工對比觀測,實現雙套自動觀測數據的對比觀測,在一定程度上解放了觀測員,推動了氣象現代化的進程[3-4]。
在雙套自動氣象站出現的同時,問題也隨之而來。雙套站擁有A,B兩套儀器,每套儀器各測出一套數據,許多服務只需要一套觀測數據進行分析處理即可,因此,如何將A,B兩套儀器的觀測數據融合為一組數據成為自動氣象站亟需解決的問題[5-6]。本研究利用安徽氣象局祁門站由A,B兩套儀器測得的氣溫觀測數據,對原始數據進行有效處理后,利用基于空間一致性的主備法,基于數據的滑動方差和標準差,對數據賦以不同權重的權重法,基于差值訂正的合成法氣象數據進行融合。分別將3種方法的融合結果與安徽氣象局祁門站觀測數據進行比較,對其進行分析和評估[7-8],并比較3種方法的融合效果,得出結論。
2 ? ?算法簡介
2.1 ?主備法
主備法的思想為當兩套觀測數據偏差在最大許可范圍之內,將其中一套儀器作為主站,另一套作為備用站;當數據差值異常時,利用空間一致性判斷,用對應的數據替換異常值。
3 ? ?算法結果與評估
本研究使用的數據是祁門雙套站2016年1—5月的數據,涉及氣溫、地溫、氣壓、蒸發量等多個要素,以及同時期周邊4個臺站(休寧站、黟縣站、歙縣站、屯溪站)的氣象數據資料,和祁門站的人工檢測氣象數據,如表1所示。
圖1—5為3種算法5種方法,合成法的融合結果、以A為主站的融合結果、以B為主站的融合結果、基于滑動方差的融合結果、基于滑動標準差的融合結果與觀測值的差值的比較。
由圖1和圖2可以直觀地看出,主備法差值的波動程度最大,由算法公式可以看出,主備法的精確度為0.10,合成法的精確度為0.05,而權重法的精確度最高。所以并不能從超差率就斷言哪個算法最好。主備法的超差率最小的原因在于A,B兩站的觀測數據相差較小,在±0.4內,A,B兩站與本站觀測數據相差較大,若A數據與觀測值相差0.4,B數據與觀測值相差0.6,從算法角度而言,以A為主站的主備法融合差值為0.4,權重法的融合差值在0.4~0.6,而合成法差值為0.5,導致了權重法及合成法的超差率較主備法大。但論精度權重法最好,合成法次之,主備法最差。因此,如果A,B站與觀測值之間相差不大,權重法的融合效果最好。
由算法可知,主備法的優勢在于利用了空間一致性。在發現原始數據出現較大異常的情況下,單單將缺測一方用另一方的數據來填補并不夠,還必須對其進行數據是否差異過大進行判斷[9]。當選出差異過大的數據后,則應找到一個標準來衡量是因為哪一方的數據異常,才導致了兩組數據差值過大的情況發生[10-11]。此時,選擇1~2個與自動站無關的數據作為標準,顯然比直接選取A站或B站本身作為標準要合理。本研究選擇了與自動站數據相獨立的周邊站臺數據作為衡量的標準,擺脫了自動站數據本身的影響。利用空間的均勻性加權得到的與自動站所在位置的氣象數據相接近。選擇該數據作為處理異常數據的標準,可以合理地找到異常的一方,即與標準數據差異較大的一方。再將標準數據替換掉異常的數據,使得處理之后的數據與真實的數據值較為接近,且兩組數據的差異較小,有助于融合出更貼近真實值的數據[12]。
權重法的優勢在于不僅利用主備法中的空間一致性對數據進行了預處理,并且在數據融合的整個過程中,沒有采取傳統的對整個樣本求方差、標準差的方法,而是采用了只選取該點數據附近一定數量的數據作為計算樣本進行運算,將其稱之為滑動方差、標準差。本文將滑動長度定為20,考慮到氣象數據會隨著時間的往后推移,呈現出較大的變化,或者出現周期性特征會對數據的方差、標準差產生影響,從而影響對于A,B自動站本身觀測數據穩定性的判斷,將方差的計算樣本控制在20以內,可以有效消除這種影響。
合成法的優勢在于當A,B站觀測數據在0.4之內時,將普遍意義上更接近于真值的均值當作融合數據;當A,B站差值超出誤差允許范圍時,將此時數據與前面4個時次的差值相比較,得出跟接近于真值的融合數據。
4 ? ?結語
本研究利用安徽氣象局祁門站的由A,B兩套儀器測得的氣溫觀測數據,對主備法、權重法和合成法進行分析和評估。結果表明,基于空間一致性的主備法,基于數據的滑動方差和標準差、對數據賦以不同的權重的權重法,基于差值訂正的合成法這3種算法都是合理、可行的。三者的精確度不同,主備法的精確度為0.1,合成法的精確度為0.05,權重法的精確度最高。在不同的數據條件下三者的融合效果也不同,若在A,B站觀測值相近但與本站觀測數據相差較大的情況下,主備法的融合效果更佳;若在A,B站觀測值相近且與本站觀測值也相近的條件下,權重法的融合效果更好。
總的來說,雙套站的自動觀測方法可以在很大程度上解決單套運行的自動站由于設備故障、環境因素所造成的觀測數據異常以及缺乏同時期、同要素數據的對比問題,大大提高了觀測氣象要素的準確度。
[參考文獻]
[1]華連生,華洋,徐光清,等.“雙套站”氣溫模擬評估[C].廈門:第28屆中國氣象學會年會,2011.
[2]溫華洋,徐光清,華連生,等.“雙套站”數據處理方法探索[C].廈門:第28屆中國氣象學會年會—S1第四屆氣象綜合探測技術研討會,2011.
[3]唐為安,吳必文,徐光清,等.安徽國家基準氣候站自動與人工氣溫對比分析[C].杭州:第26屆中國氣象學會年會第三屆氣象綜合探測技術研討會分會場,2009.
[4]溫華陽,徐光清,張虎,等.雙套自動氣象站數據評估及其優勢探討[J].應用氣象學報,2012(6):748-754.
[5]李艷萍.地理信息系統與氣象的融合應用[J].廣西氣象,2004(S1):72-74.
[6]汪冬華.多元統計分析與SPSS應用[M].上海:華東理工大學出版社,2010.
[7]盛驟,謝世千,潘乘毅.概率論與數理統計[M].北京:高等教育出版社,2008.
[8]鄭明,陳子毅,汪嘉岡.數理統計講義[M].上海:復旦大學出版社,2006.
[9]邱聲春.數據挖掘和數據融合技術在天氣預報和氣象服務中的應用研究[J].山西氣象,2007(2):34-36.
[10]楊華,林卉.數據融合的研究綜述[J].礦山測量,2005(3):24-28.
[11]楊明,馮徑.氣象多數據源數據融合模型研究[J].計算機與現代化,2005(3):13-14.
[12]石陽,劉東華,邱宗旭,等.智能專業氣象信息融合與服務系統初步探討[J].廣東氣象,2012(6):51-54.
Abstract:The records of meteorological data were obtained by manual observation and recording in the early stage. With the improvement of computer technology and automation level, the meteorological data of some meteorological observation stations gradually began to use instruments to record meteorological observation data automatically. Based on the temperature observation data measured by A and B two sets of instruments in Qimen station of Anhui Meteorological Bureau, this paper proposes three fusion data algorithms after effective preprocessing of the data. One is the main-standby method based on spatial consistency, the other is the sliding variance and standard based on data ?difference, the weighting method with different weights on the data, and the third is the synthesis method based on the difference correction. The three algorithms are analyzed and evaluated and the fusion effect of the three methods is compared. The results show that the three algorithms are reasonable, and the fusion value can basically reflect the real situation.
Key words:meteorological; sliding variance; spatial consistency; data fusion