李秀英,荀偉唯,李瑞蘇,楊翠麗
(1.沙河市氣象局,沙河 054100;2.河北省清河縣氣象局,清河 054800)
由于風向的瞬時變化較大,現有的數據質量控制標準中未對風向時間一致性檢查設定最大允許變化范圍。隨著觀測自動化的發展,國家氣象觀測站實現了雙套風向傳感器同時運行,且2套風向傳感器安裝在同一觀測環境里,高度相同,水平距離間隔1.5 m左右,使獲取到的觀測數據有可比性。
現階段風向質量控制方法較少,如:質量控制標準[1]中只對風向數據是否出現在0°~360°進行判斷;張永軍[2]等提出了基于分布律規則的風向傳感器故障檢測算法,需要大量的歷史數據作為統計樣本,且對故障檢測具有一定的滯后性;楊麗中[3]等采用風向數據排列規律分析法,發現了風向頻率分布波形跳躍可作為風向傳感器故障判斷的間接依據;陳峰云[4]采用反查格雷碼法,通過檢測某些方位永遠缺失的現象查找風向故障點;李昕娣[5]等采用雷達圖進行風向傳感器數據偏差分析;何利德[6]等利用集合理論定位判定故障方法;金燦[7]等提出通過7個發光二極管判斷7位格雷碼故障點,但是必須具備專業工具才可以進行檢測。
風向的突變、長時間的靜風、儀器故障、數據缺測等特殊情況都會造成新型站與備份站的風向差值很大,但是在一定的概率范圍內,可以設定一個差值閾值,嘗試對風向進行質量控制標準的設定,進一步提高數據的完整性和準確性。
文章對比分析新型站與備份站風向傳感器氣象要素數據,通過差值對比的方法計算出備份站與新型站風向的差值,再對差值進行區間劃分求得區間占比,從而確定風向變化較為合理的最大允許變化閾值。
文章選用2019—2020年新型站AWS_H_Z文件(小時數據文件)、備份站Z文件(小時數據文件)中的2 min風向風速、10 min風向風速、瞬時風向風速的小時數據以及2020年1月新型站AWS_M_Z文件(分鐘數據文件)、備份站RTD文件(分鐘數據文件)中的2 min風向風速、10 min風向風速、瞬時風向風速的分鐘數據。
通過差值對比的方法可計算出備份站與新型站風向的差值,再對差值進行區間劃分求得區間占比,找出占比達到或超過90%時的最大區間,將此區間確定為風向的最大變化界限值,即將區間占比之和≥90%的區間范圍定義為差值閾值。
對2019—2020年17,532個有效小時數據的風向差值以10°為區間進行劃分,統計區間內出現的次數,從而計算得出區間占比值。
通過計算得出:當差值閾值定義為±20°時,2 min風向區間占比為91.4%,10 min風向區間占比為92.4%,瞬時風向區間占比為60.1%,而瞬時風向差值閾值定義為±50°時區間占比為90.8%。
對新型站與備份站2020年1月44,579個有效分鐘數據的差值以10°為區間劃分。
經統計得出:差值閾值定義為±20°時,2 min風向區間占比為94.0%,10 min風向區間占比為93.0%,瞬時風向區間占比為69.6%,而瞬時風向差值閾值定義為±50°時區間占比為93.6%。
分析新型站2020年1月風向分鐘數據,對分鐘數據之間的風向差值以10°為區間劃分。
經統計得出:差值閾值定義為±20°時,2 min風向區間占比為93.3%,10 min風向區間占比為99.0%,瞬時風向區間占比為73.6%,而瞬時風向差值閾值定義為±50°時區間占比為95.0%。
綜上所述,在區間占比90%概率范圍內風向的差值存在一個區間閾值。2 min,10 min風向最大允許變化閾值定義為±20°,瞬時風向最大允許變化閾值定義為±50°較為合適。
2020-02-22T06:10—2020-02-22T06:30,風向發生突變,1 min變化達到60°,差值為-124°。
正常情況下突變的時間不會持續很長,且新型站與備份站突變的趨勢基本一致。
2020-01-03T08:10—2020-01-03T08:30,2 min風向差值較大,原因為風速為0(靜風)。
由于備份站2 min風向風速出現缺測,造成風向差值較大。
當風向變化較小時,2 min風向差值閾值±20°,10 min風向差值閾值±20°,瞬時風向差值閾值±50°有較好的可用性。
檢驗:2020-07-17風向變化較小,2 min風向差值在-9°~18°,差值閾值±20°達到100%;10 min風向差值在-3°~14°,差值閾值±20°達到100%;瞬時風向差值在-63°~74°,差值閾值±50°達到98%,如表1所示。

表1 2020-07-17新型站與備份站分鐘數據風向差值區間占比
通過備份站風向數據對新型站風向數據進行實時質控,當差值超出閾值范圍時,提示數據可疑。經分析,風向突變、長時間靜風、儀器故障、數據缺測等都會造成差值超出閾值范圍,此種情況下需要參考新型站與備份站風向隨時間的變化情況和風速值進一步判定:
1)正常的風向突變,新型站與備份站分鐘數據同時發生突變,而且持續時間較短,可以判斷為正常數據;
2)當風速較小或為靜風,且持續時間較短時,可以判斷為正常數據;
3)當風速較小或為靜風,且持續時間較長時,應考慮風傳感器出現故障或被凍結;
4)當出現數據缺測或長時間超過閾值時可判定數據可疑,考慮風向傳感器出現故障。
文章對比分析了新型站與備份站的風向數據,確定了數據質量控制標準中風向要素質控閾值,并初步構建了風向數據質量控制方法。
該方法與其他氣象要素相比風向瞬息多變,在確定最大允許變化范圍時只確定了在一定概率范圍內的質控閾值,當數據超出閾值范圍時,提示數據可疑,還需要參考新型站與備份站風向隨時間的變化情況和風速值進一步判定,排除正常的風向突變及風速較小時引起的超閾值情況,目前尚無法確定可以判定數據錯誤的差值閾值。隨著大數據的發展,希望今后能夠增加對不同區域內風向變化的研究,找出更為合理的質量控制方法。