徐昕,許暉
(吉林省氣象信息網絡中心,吉林長春130062)
MDOS系統是以臺站級數據監測、省級數據質量控制、國家級數據質量評估三級質控體系為主線,集成數據上傳監控、國家站數據指控信息處理、區域站數據指控信息處理、元數據信息處理等基本數據質控處理功能,還包含了A、J、Y文件制作管理、數據質量評估考核等服務產品。
省級數據處理人員通過該系統能夠清晰了解實時資料上傳情況,一旦發現缺報或空報現象,及時與臺站取得溝通,大大提高了數據的實時性。通過該系統的數據指控信息處理功能,能夠對數據進行批量檢索,對于質控系統提出的疑誤信息進行二次人工判斷,并將判斷后有異議的數據返回臺站進行核對,增加了省級與臺站級的數據交流,這樣大大提高了氣象數據的準確性。
吉林省共有55個國家地面觀測站,1380個區域自動氣象站。其中,國家基準氣象站4個,國家基本氣象站26個,國家一般氣象站25個。1380個區域站在吉林省內均勻分布(見圖1)。

圖1 吉林省國家地面觀測分布情況
全省1435個地面觀測站實時監測氣象數據,省級通過MDOS系統接收來自于國家站的分鐘數據、小時數據、日數據、日照數據,以及來自于區域站的小時數據。
調取 MDOS系統中 2015年 10月 30日 20:00~2016年 10月30日 20:00(北京時間),吉林省 55個國家站疑誤信息,共計26254條,并對這些疑誤信息進行細化質量分析與評估。
將全部疑誤數據按照要素種類進行分類,共計要素120個。對同種類要素進行數量合并,匯總基礎種類共計17個(詳見圖2)。
可見,在所有要素中,地溫、降水、能見度為疑誤產生次數最多的幾類,分別占全部的31.96%,15.77%,12.31%。下面將針對這幾類問題進行詳細分析。

圖2 按觀測要素分類疑誤數據比例圖
對所有地溫類疑誤數據產生時間進行分析,可以得出表1,地溫疑誤數據時間分類。

表1 按產生時間分析地溫要素疑誤數據數量表
通過疑誤數據數量排序可知,3月、1月、7月為產生問題較多月份,均在1000條以上。由此推斷,1~3月、6~10月地溫問題明顯(見圖3)。

圖3 地溫疑誤數據統計圖
對所有地溫類疑誤數據進行要素詳細分類,可以看出D40、D10、D05、D20為產生疑誤信息次數最多的四類,均在1000條以上,相反的,D320、D160、D80的疑誤信息數量較少,均在400條以內。由此可以推測,產生地溫疑誤信息的主要原因在于淺層地溫要素。
綜合表1的分析,可以總結出,地溫類要素產生疑誤信息最多的月份在于降水較多的季節,且淺層地溫傳感器受到的影響較大。以上結論符合常年觀測實際經驗,根據對臺站數據的分析及以往實地調研結果可以初步推測,產生這種情況的主要原因在于,降水較多的季節經常會造成淺層積水,會對地溫觀測數據的正確性產生影響,造成觀測數據不準確,或經過長時間浸泡,使淺層地溫觀測儀器發生故障。
對所有降水類疑誤數據產生時間進行分析(見表2),可以看出,降水疑誤數據產生月份。

表2 按產生時間分析降水要素疑誤數據數量表
可見,降水問題最多的時間主要集中在6~10月份,為每年夏季降水較多的汛期。
將所有降水疑誤數據進行產生級別的分析,可以得出表3:降水疑誤數據產生級別。

表3 按產生級別分析降水要素疑誤數據數量表
由表3可以看出,幾乎全部的疑誤數據都是由省級質控和臺站主動修改,且臺站主動修改的數量占全部的70.37%,是省級質控比例29.55%的兩倍以上。由此可以說明,降水類疑誤數據從產生級別來看,主要產生原因為臺站未及時發現數據錯誤,而是通過mdos系統滯后提交修改。
綜合分析降水疑誤數據錯誤描述和反饋描述進行分析。
經統計,錯誤描述原因統計共計195種,進行相似原因合并后,共計54種。對這些錯誤描述進行統計整理,可以得出表4,可見,“降水缺測”為最主要原因。錯誤描述統計。

表4 按錯誤描述降水要素疑誤數據數量表
針對錯誤描述中出現最多的原因“缺測”進行反饋描述分析,可以得出表5:缺測對應的反饋描述。

表5 按缺測對應的反饋描述分析降水要素疑誤數據數量表
由表5可見,造成雨季降水要素出現疑誤信息“缺測”的最主要原因在于儀器故障。經長期數據處理經驗及以往臺站調研考察經驗,初步總結造成汛期降水觀測儀器故障的原因有:因相對濕度過大或儀器過于敏感經常造成的降水數據出現0.1mm野值;因降水量過于集中導致超出翻斗式雨量傳感器測量最大翻轉頻率,而無法得到準確數據;因雨水長時間浸泡導致傳感器故障,經常在無降水時次出現缺測。
綜合對表1~表5進行分析,可得到以下結論:
吉林省地面觀測降水疑誤信息主要出現在6~10月降水較多的月份,其主要疑誤是由于儀器故障導致的非正常降水缺測,提出此疑誤信息的級別主要為臺站。針對以上降水問題,今后應加強臺站日常數據維護,提高實時上傳準確率,減少月末制作A文件時對數據質疑的突擊,并加強在汛期對儀器的維護。
對2015年~2016年一年內能見度疑誤數據的錯誤描述和反饋值進行統計分析,得到表6,錯誤描述分類。

表6 按錯誤描述分析能見度要素疑誤數據數量表
根據表6所示的反饋值情況統計可見,78.6%的反饋值為缺測,證明經臺站反饋確認后仍無法得到正確能見度值。

表7 缺測對應的反饋描述分析能見度要素疑誤數據數量表
綜合表6和表7可知,在能見度觀測的過程中,存在問題最多的為缺測,經過與臺站溝通確認,78.60%的能見度缺測數據需使用備份站數據或人工內插等方式,這大大增加了人工的工作量和出錯概率。
經過對吉林省2015年 10月30日 20:00~2016年 10月 30日 20:00(北京時間)55個國家站疑誤信息(共計26254條)觀測數據的分析,可以看出:
導致地面觀測數據質量下降的主要觀測要素是地溫(31.96%)、降水(15.77%)、能見度(12.31%)。
產生這些要素疑誤的主要月份為每年6~10月(地溫疑誤的主要月份還有1月~3月)。
產生這些要素疑誤的主要原因多為降水導致的儀器故障。因此,今后應加強對儀器的維護,尤其是地溫傳感器、降水傳感器、能見度儀的維護。在6~10月對儀器巡查頻次應增加,盡量減少因儀器損壞導致的數據缺失。