王超然 文強







摘要:以黃石國家氣象觀測站地面氣象數據為例,研究如何將軟硬件差異較大的主備雙套自動氣象站數據放到同一平臺進行數據對比分析。通過將絕對差值、標準差值等數據結合的方法進行分析,提升國家級自動氣象站的自動探查錯與糾錯能力,并以地面氣象數據中的氣溫、氣壓數據為例,將本文數據處理方法代入后進行自動判別試驗。結果表明:通過使用本文方法,可以達到自動判別錯誤數據源的預期效果。
關鍵詞:自動氣象站;氣象數據;質控;分析方法
中圖分類號:P413.21 文獻標志碼:A 論文編號:cjasl8030028
Research and Application of Comparison Algorithm of Meteorological Data from
Main and Standby Automatic Weather Stations.
Wang Chaoran1, Wen Qiang2
(1Hangshi Meteorological Bureau of Hubei, Huangshi 435000, Hubei, China;?2Shiyan Meteorological Bureau of Hubei, Shiyan 442000, Hubei, China)
Abstract: Taking ground meteorological data of Huangshi National Meteorological Station as the samples, we?compare and analyze the data of main and standby automatic meteorological stations in the same software. By?combining the absolute differences and standard deviation values, we aim to improve the functions of automatic debugging and automatic error correcting of the state- level meteorological stations. Besides, data of temperature and air pressure of ground meteorological data are used for the automatic identification test with?the data processing methods proposed by this study. Results show that the expected effects of automatic?identification of wrong data source can be achieved.
Keywords: Automatic Weather Station; Meteorological Data; Quality Control; Analysis Method
0 ?引言
國家級地面自動氣象站是國家乃至全球地面氣象觀測數據的主要來源之一,其數據可用率對預報與服務的影響重大。中國氣象局印發的《綜合氣象觀測業務發展規劃(2016—2020年)》中要求“加強數據質控能力,研發觀測數據質量聯合檢驗技術方法”。
提高氣象數據可用率,除了要求氣象設備性能的提升外,還需要高效的數據質量控制方法。國內外許多專家都在不斷優化數據質量控制的算法[1-5]。例如,王興等[6]利用溫度場與氣壓場資料將IDW算法加以優化,改進了直接用各站點氣溫數據進行插值的空間一致性質控方法[7-11]。王海軍等[12-13]基于氣溫日變化規律與數據插值技術的小時氣溫界限值質控方法。這些方法都在更廣的時空維度上將原有的數據質控算法更加優化,取得了很多研究成果。
隨著氣象現代化程度的提高,新的設備也越來越多,以湖北省為例,全省國家級自動氣象觀測站大多數都是一主一備雙套自動氣象站(以下簡稱主備站)同時運行。這樣在同一時間、同一空間就有兩份數據作為數據源。本文研究如何通過對主備站氣象數據(氣溫、氣壓、相對濕度、風向、風速)進行實時對比質控分析,及時發現自動站在運行中出現的疑誤數據,從而加強數據質控能力,提高氣象觀測數據的可用率。
1 ?數據來源
主備站數據實時獲取首先要克服軟硬件平臺不兼容的問題。以湖北為例,備份站以ZQZ型自動氣象站為主,一般使用OSSMO2004軟件,分鐘文件存放在ZZ.txt(簡稱ZZ文件)中;主站以DZZ5型自動氣象站為主,一般使用ISOS軟件進行數據采集加工存儲,ISOS分鐘數據存放在AWS_M_Z_IIiii_yyyyMMDD.txt(簡稱M_Z)文件中[14-16]。主備雙站分鐘數據文件名、文件格式、存儲位置都不相同。為了使雙站數據能在同一平臺下進行數據對比,可以采用主備雙站都會生成并推送的Z_SURF_I_IIiii_yyyy MMddhhmmss_O_AWS FTM[-CCx].txt(簡稱長Z文件)進行數據對比。
長Z文件每5min生成一個。不管是OSSMO2004軟件還是ISOS軟件,都可以自動將每5min生成的這個文件推送到目的地址。這樣只需在目的地址負責接收入庫即可。甚至可以將備份站5min數據設置成區域站數據進行接收,與ISOS發送的國家站數據一同入CIMISS數據庫。這樣數據可以直接在數據庫中進行對比分析。
2 ?數據對比分析方法
在獲取氣象要素數據后,就可以對獲取到的數據進行對比分析。對于所有的氣象數據,進行四種狀態判斷:正確、可疑、錯誤、缺測。前3種狀態判斷依據的是臺站自行設置的閾值。一般的數據判斷,每個氣象要素臺站可自行設置兩個閾值,分別為可疑閾值與錯誤閾值,通過數據之間的差值來標記數據狀態[17]。默認可疑閾值根據第二代新型自動站功能規格書儀器最大允許誤差確定[18](如:氣溫為±0.2℃,氣壓為±0.3Pha,相對濕度為±3%,風速為±0.5m/s等)。錯誤閾值則根據臺站自身情況自行設置。
2.1 差值判斷法
氣溫、氣壓、相對濕度、風速等直接采用差值法進行判斷。設主備兩套儀器觀測的兩組數據為{ai}與{bi},可疑閾值設置為α,錯誤閾值為β,i=1,2,3,…,n[19-20]。差值判斷公式如(1)所示。
令△ab=|ai-bi|,△ab≤αai與bi標記正確
α<△ab<βai或bi標記可疑
△≥βai或bi標記錯誤 ???(1)
有的氣象要素,如雨量的判斷不能直接用閾值進行對比分析。根據《地面氣象觀測規范》,雨量判斷標準是百分比,差值相差4%以上說明數據有誤。但觀測站如果出現少量降水,如2.0mm降水,相差0.1mm降水就使差值達到5%。在實際工作中,這種少量降水量導致降水量誤差大于4%的現象不一定是儀器不準。對于這種氣象數據,需要加入臨界值的數據狀態標記方法。
降水臨界值判斷公式如(2)所示。
R0≤LR ?△R=|R0-R1|
R0>LR ?△R=|R0-R1|/R0×100%(2)
式中LR為臨界值,R0為主站實際降水量,R1為備份站降水量。當R0≤LR時用差值判斷,當R0>LR用百分比進行閾值判斷。差值與百分比分別設有可疑閾值α、錯誤閾值β,數據標記方法同公式(1)。
有的氣象要素,在判斷時與其他氣象要素具有較強的相關性。如風向要素的判斷就與風速關系緊密。當風速較小時,風向差值可能較大,當風速較大時,風向差值較小。
風向判斷公式如(3)所示。
TS0=FS1=C 靜風,判斷為正確
C<FS0≤Lf △FX0=|FX0-FX1| (3)
FS0>Lf △FX1=|FX0-FX1|
FS0為主站風速,FS1為備份站風速,FX0為主站風向,FX1為備份站風向,△FX0為主站風速小于或等于臨界風速Lf時的差值風向,△FX1為主站風速大于臨界風速Lf時的差值風向。數據判斷標記方法同公式(1)。
2.2 標準差判斷法
在數據對比分析里,雙站對比無基準數據做參照,當可疑或錯誤數據出現時,既有可能是主站出現故障,也有可能是備份站出現故障。對于氣溫、氣壓、相對濕度等時間上有連續性相關的要素可采用差值標準差的方式,判斷現在獲取的數值與過去連續獲取數值之間的離散程度,從而判斷故障是出現在主站還是備份站[21]。
要獲取一組數據{xi}的標準差,首先要得到前i-1,i-2,…,i-n個氣象要素的算數平均值μ。μ的計算公式如(4)所示。
μ=(xi+xi-1+xi-2+…+xi-n+1)/n(4)
標準差公式如(5)所示。
(5)
式中xi為第i個氣象要素值。軟件中n的取值為6,由于氣象數據獲取的為每5分鐘獲取一次數據,{xi}即為30min氣象要素集合。
若氣溫、氣壓、相對濕度等氣象要素首先被閾值判斷標記為錯誤,則對主站{ai}與備份站{bi}取半小時的標準差σa與σb進行比較,如公式(6)所示。
△σa≤△σb主站正確
△σa>△σb備份站正確(6)
3 ?方法的驗證
在實踐中,用本文方法對氣溫、氣壓、相對濕度進行驗證。
3.1 氣溫數據驗證
氣溫、氣壓、相對濕度等具有相似的連續性變化規律,本文以氣溫數據為例,將差值與標準差判別法初步的驗證于2017年2月的黃石國家基本氣象站氣溫數據中。具體數據如圖1所示。其中本站值為經過差值與標準差值進行自動判斷糾正后的輸出值。
在2月15日10時左右,備份站氣溫傳感器出現故障,隨著氣溫升高,備份站溫度值卻反而降低,△ab在9時35分超過0.4℃,主站溫度為15.5℃(前半小時數據15.1、14.9、14.7、15.2、15.5℃),備份站為10.5℃(前半小時數據15.1、14.6、14.5、14.8、10.5℃),半小時標準差運用差值與標準差值進行判斷糾正后,最終的本站值選擇與主站值保持一致。直到15日18時后更換溫度傳感器,數值恢復正常。第二次備份站數據出現異常是在在20日8時后,由于電壓故障,導致8時30分開始出現負值,通過差值與標準差值進行判斷糾正后,本站值自動調整為與主站一致。
3.2 氣壓數據驗證
氣壓數據的驗證同樣采用2017年2月主備站數據。20日8時后因電壓故障,同樣導致備份站氣壓數據跳變。如圖2所示。△ab在8時45分超過0.6Pha,主站氣壓為1005.7Pha(前半小時數據1005.5、1005.8、1005.9、1005.7、1005.7Pha),備份站為1008.2Pha(前半小時數據1005.6、1006.0、1006.3、1006.1、,1008.2Pha),半小時標準差△σa(1.3)≤△σb(9.0)。故判斷為備份站故障,本站值選取主站值。
4 ?結論
本文主要通過主備份自動站資料對比分析,探索能夠及時發現異常數據的方法,并嘗試對部分異常數據進行自動糾正(如氣溫、氣壓、相對濕度等)。但對部分無序數據(如雨量、風等)只能進行閾值報警。主要得出以下結論:
(1)氣溫、氣壓、相對濕度等數據在天氣變化平緩時能夠達到預期的發現錯誤并糾正的效果。
(2)在夏季或天氣變化劇烈(如短時雷雨),氣象數據短時間變幅較大時,數據短時間變幅較大,可能導致糾正效果不佳。
(3)標準差判斷法本質是判斷數值的離散度,當儀器設備靈敏度下降的情況下,會導致判斷結果失真。
(4)雨量與風速數據通過對比,可以判斷主站或者備份站出現了故障,具體判斷故障出現在哪個站,僅通過主備站數據分析難以做到,需要其他區站資料或是雷達衛星資料進行綜合分析。
參考文獻
[1]Hubbard, Kenneth G, Nathaniel B G, et al. An improved QC?process for temperature in the daily cooperative w eather observations[J].J Atmos Ocean Technol,2007,24:206-213.
[2]Durre I, M enne M J, Gleason B E, et al. Comprehensive auto-?mated quality assurance of daily surface observations[J].J Appl M?eteor Climatol, 2010,49:1615-1633.
[3]Sciuto G, Bonaccorso B, Cancelliere A, et al. Probabilistic quality?control of daily temperature data[J].International Journal of?Climatology,2013,33(5):1211-1227.
[4]任芝花,熊安元,鄒鳳玲.中國地面月氣候資料質量控制方法的研究[J].應用氣象學報,2007,18(4):516-523.
[5]Taylor J R, Loescher H L. Automated quality control methods for?sensor data: a novel observatory approach[J].Biogeosciences,2013,?10(7):4957-4971.
[6]王興,苗春生,江燕如,等.臺站溫度質量控制中IDW算法改進及應用[J].氣象科技,2014,42(4):605-611
[7]陸忠艷,袁子鵬,蔡福,等.基于GIS的氣溫和降水推算方法研究[J].氣象科技,2008,36(4):389-395.
[8]Anderson S. An evaluation of spatial interpolation methods on air temperature in Phoenix,Arizona State [EB/OL].[2013-06-27].http://?www.cobblestoneconcepts.com/ucgis2summer/anderson/anderson.?htm,2012,6.
[9]楊曉霞,沈桐立,徐文金,等.最優插值客觀分析方法[J].南京氣象學院學報,1911,14(4):566-574.
[10]Lu G Y, Wong D W. An adaptive inverse-distance weighting spatial?interpolation technique[J].Computers and Geosciences,2008,34(9):?1044-1055.
[11]尹嫦姣,江志紅,吳息,等.空間差值檢驗方法在地面氣象資料質量控制中的應用[J].氣候與環境研究,2010,15(3):229-236.
[12]王海軍,楊志彪,楊代才,等.自動氣象站實時資料自動質量控制方法及其應用[J].氣象,2014,33(10):102-109.
[13]王海軍,閆蕎蕎,向芬,等.逐時氣溫質量控制中界限值檢查算法的設計[J].高原氣象,2014,33(6):1722-1728.
[14]中國氣象局.地面氣象觀測數據文件和記錄簿表格式[M].北京:氣象出版社,2005:3-4.
[15]中國氣象局氣象探測中心.臺站地面綜合觀測業務軟件(ISOS)用戶操作手冊[M].北京:氣象出版社,2014:195-196.
[16]中國氣象局監測網絡司.第二代自動氣象站功能規格書,2010.
[17]Parolari A J, Katul G G, Porporato A. An ecohydrological?perspective on drought- induced forest mortality[J].Journal of?Geophysical Research Biogeosciences,2014,119(5):965-981.
[18]中國氣象局氣象探測中心.新型自動氣象(氣候)站評估報告.2010.
[19]溫華洋,徐光清,張虎,等.雙套自動氣象站數據評估及其優勢探討[J].應用氣象學報,2012,23(6):748-750.
[20]呼群,孔祥晨.東勝國家基本氣象站雙套自動站資料對比分析[J].安徽農業科學,2015,43(5):182-184.
[21]溫華洋,華連生,金素文,等.基于空間一致性的雙套站數據選取方法探索[J].氣象,2013,39(8):1069-1072.