李珍 賈晨剛
摘 要
氣象資料是氣象業務、科研和服務等工作的基礎,數據資料的準確與否直接影響著中尺度、短時效等天氣預報的準確性和有效性。根據陜西省自動氣象站的實際情況,采用計算機自動實時質量控制方法對自動站數據進行有效地質量控制,其質控結果準確度高于傳統的人工質量控制方法,數據可信度較高。
【關鍵詞】自動氣象站 質量控制 實時控制
隨著現代化技術的發展,中小尺度、短時天氣時效等天氣預報的需求日益高漲,為滿足日益高漲的氣象服務的需求,中尺度、短時氣象觀測資料是必不可少的。目前,世界上許多國家都建立了分布密集的地面自動站觀測網絡,我國的地面自動站觀測網絡也在日趨完善。隨著“自動化觀測技術”項目的實施,陜西省從2003年開始建設自動氣象站,前后經過三年建設,于2005年建成了覆蓋全省的自動站觀測網,包括100個國家級自動站。由于自動站觀測時通過傳感器、數據采集、數據通訊等系統自動進行實施采集數據,形成觀測報告,生成和傳輸數據文件等過程,觀測數據經過的每個過程都可能產生錯誤數據,由于實時性強、人工干預少、缺少對錯誤觀測數據的補救措施,因此,自動觀測出現錯誤數據的幾率遠遠高于人工觀測,在自動站觀測資料應用前,進行質量控制是十分必要的。
1 自動氣象站質量控制技術
1.1 數據質量控制碼的規定
在對數據進行質量控制(QC)的過程中,隨著控制進程的進行,需要不斷的對被檢數據設置或修改QC碼。QC碼的規定如下:
數據正確: QC碼=0
數據可疑: QC碼=1
數據錯誤: QC碼=2
1.2 數據質量控制技術
傳統的質量控制主要根據氣象學、天氣學、氣候學原理,以氣象要素的時間、空間變化規律和各個要素間相互聯系的規律為線索,分析氣象資料是否合理。其方法包括:范圍檢查、極值檢查、內部一致性檢查、空間一致性檢查、氣象學公式檢查、統計學檢查、均已性檢查,這些方法被普遍應用到地面氣象資料的質量控制中。
我國地面觀測資料實行氣象臺站、省級、國家級的三級質量控制系統,各級質量控制軟件融合了自動控制技術和交互式應用技術,提高了自動進程能力,允許在必要時對特殊資料進行詳細的人工分析判斷與修正。臺站級質量控制是氣象資料質量控制的基礎,包括觀測系統的維護、儀器檢定、觀測數據在采集器和數據處理環節的基本質量控制。本文將重點介紹陜西省省級自動氣象站資料的質量控制方法,省級自動氣象站質量控制方法主要包括:氣候學界限值檢查、氣候極值檢查、內部一致性檢查、空間一致性檢查、時間一致性檢查等,同時根據自動站實時數據文件的特點引入數據文件格式檢查、傳感器狀態文件檢查方法,最后綜合評價要素數據質量。我省針對日常業務中使用的氣溫、雨量、氣壓、風速風向和地面溫度5類項目17個要素在實時和準實時兩個質量控制環節進行質量控制,具體所采用的方法如表1所示。
1.2.1 格式檢查
格式檢查為對數據進行質量前的預處理檢查。主要檢查文件中的數據錄入格式是否與《地面氣象觀測數據文件格式和記錄簿表格式》中規定的文件格式一致。另外進行臺站參數中站號、年、月與文件名中的站號、年、月的一致性檢查。檢查內容為:檢查數據文件中各個要素字符是否是觀測規范中的規定字符;將第一條記錄中的記錄數據和數據庫中存儲的臺站信息表進行比對,確定數據文件的正確性;將文件名中的文件生成時間和第二條記錄中的要素觀測時間進行一致性檢查。
對于沒有通過格式檢查的數據,QC碼可直接標定為2,并不再進行其他檢查。
1.2.2 傳感器狀態文件檢查
狀態信息文件每小時生成一個,為順序文件,共2條記錄。第一條記錄為本站基本參數,共20個字節,第二條記錄為各個傳感器的狀態值,共87個字節。該文件和實時數據文件在正點后一起上傳至省級數據中心,文件中記錄了自動站各種傳感器的工作狀態,0表示傳感器正常,1表示傳感器異常。只有在傳感器正常的情況下,采集到的數據才能反映大氣要素的測量值,數據是真實可靠的。結合狀態文件中的傳感器狀態值,確定數據文件中相應的測量值是否有效。在傳感器正常的情況下判定測量值有效,否則,判定測量值是錯誤值。
對于沒有通過傳感器狀態文件檢查的數據,QC碼可直接標定為2,并不再進行其他檢查。
1.2.3 極值檢查
極值檢查分為氣候學界限值檢查和臺站氣候極值檢查兩部分。
從氣候的角度不可能超越的要素臨界值稱之為要素的氣候界限值。資料形成是規定采用的表示方式和范圍,為要素的允許范圍值。超出要素的氣候界限值或允許值范圍的資料為錯誤資料。
對于沒有通過氣候學界限值檢查的數據,QC碼可直接標定為2,并不再進行其他檢查。
極值是指某個固定測站歷史記錄中某要素曾出現過的最大值(最小值),它與緯度帶、地形、高度、氣候特點等有關,氣象資料要素值是否超出極值的檢查為極值檢查。極值范圍的上限參數是否合理直接決定了極值檢查的效果,設置太低,則個別極端大的正常數據可能被作為錯誤數據處理,設置太高,則錯誤數據又可能被當做正確數據處理,因此,對自動氣象站資料的氣候極值檢查應根據各個臺站的實際情況修改極值參數。陜西省氣象檔案館在做50年氣象資料整編時,經過統計和質量控制審核確定了陜西省各個臺站的臺站極值。
為了避免將個別極端天氣的正常數據當做錯誤數據處理,未通過臺站氣候極值檢查的數據,QC碼只標注為1,并繼續進行其他檢查。
1.2.4 內部一致性檢查
對固定測站不同要素之間是否符合某種物理聯系的檢查稱之為內部一致性檢查,在質量控制中,一下要素要符合以下條件:
日最低氣溫 日定時氣溫 日最高氣溫;日最低氣壓 日定時氣壓 日最高氣壓endprint
日最小相對濕度 日定時相對濕度;10min平均風速 日最大風速;極大風速 最大風速
風向方位為“C”(靜風)時,風速 0.2m/s;極大風速 17.0m/s時,應有大風現象;有大風現象時,極大風速 17.0m/s
低云量 總云量;散輻射總量 總輻射總量;反輻射總量 總輻射總量
未通過內部一致性檢查的數據,QC碼標注為2,并不再進行其他檢查,但前提是保證與之相比較的數據QC碼為0。
1.2.5 時間一致性檢查
時間一致性檢查是利用觀測要素連續變化原理來檢驗觀測信息或觀測要素值的時間變化率,識別出不理想的突然變化,當要素資料超出一定時間內的變化范圍,則該資料視為可疑。時間一致性檢查的目的是檢驗觀測信息或觀測要素的時間變化率,識別出不理想的突然變化。它適用于高的時間分辨率,因為相鄰樣本的相關性隨著時間分辨率增加而加強。檢查判斷依據與樣本的時間分辨率有關。在實時質量控制階段主要進行連續2小時變率檢查,即將本時次的數據和上個時次的數據進行比對,超過設定閾值的數據確定為可疑數據。例如,下表是1小時氣溫和氣壓變化的時間一致性檢查中的一條規則。如表2所示。
為了避免將個別極端天氣的正常數據當做錯誤數據處理,未通過時間一致性檢查的數據,QC碼只標注為1,并繼續進行其他檢查。
1.2.6 空間一致性檢查
各氣象參數都具有一定的空間分布特點,根據這些空間分布特點及規律而進行的檢查,被稱之為空間一致性檢查。其有效性取決于觀測站網的密度和被檢參數與空間的相關程度。對于孤立的錯誤資料,空間一致性檢查是非常有效的一種質量控制方法。通常利用與被檢查臺站鄰近的臺站同一時間觀測的氣象要素值進行比較,或利用鄰近測站觀測值通過一定的插值方法計算出被檢查臺站的估計值,觀測值與估計值的比較來進行,主要方法有:Madsen-Allerupt方法和空間回歸檢驗法,有效鄰近站則規定為:與被檢站點的數據進行比較時,鄰近站數據應保證正確。而對于鄰近站點數量過少的臺站,則不進行空間一致性檢查(華山站由于海拔太高,不宜采用空間一致性檢查方法,也不成為任何站的參考點)。
為了避免將個別極端天氣的正常數據當做錯誤數據處理,未通過空間一致性檢查的數據,QC碼只標注為1,并繼續進行其他檢查。
1.2.7 綜合分析法
在完成以上質量控制檢查后,對未通過臺站極值檢查、時間一致性檢查和空間一致性檢查之一的數據的將繼續對這些數據進行綜合分析對比。若同一數據的三個QC碼之和為3,即以上三種質控檢查均未通過,則認為該數據錯誤,QC碼標注為2;若QC碼之和為2,空間一致性QC碼為1,則認為該數據錯誤,QC碼標注為2;若QC碼之和為2,但空間一致性QC碼為0,則認為該數據可疑,QC碼標注為1,這是因為空間一致性檢查的敏感度最好,又解決確定性問題,故在綜合分析是,空間一致性檢查的結果將給予較多的考慮權重;若QC碼之和為1,則認為該數據可以,QC碼標注為1。
1.3 數據質量控制結果分析
為檢驗經過上述質量控制方法軟件系統自動進行質控后結果的準確度,將2010年7月陜西省100個自動站的實時資料從數據庫中提取出來,采用原始人工質量控制方法再一次進行質量控制,并進行比較,計算機實時質量控制結果人工驗證結果為(以個別要素為例):
1.3.1正點氣溫
在實時質量控制階段總共檢測出了50個可疑和錯誤數據。經過人工審核,除2個可疑數據改為正確,其他數據質量控制碼均正確未變,正確率為96%。
比對兩個數據:
2010年7月2日14時戶縣氣溫數據:小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷正點氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫≤最高氣溫;人工審核時只針對了單一的正點氣溫要素,判斷為正確。對比兩種結果,計算機判斷是準確的。
2010年7月5日14時戶縣氣溫數據:小時正點氣溫36.9℃,小時最高氣溫23.1℃,小時最低氣溫缺測。同上,計算機判斷應該是準確的。
1.3.2最高氣溫
在實時質量控制階段總共檢測出了50個錯誤和可疑數據。經過人工審核,1個可疑數據改為正確,其他數據質量控制碼未變,正確率為98%。
比對所更改的數據:
2010年7月2日14時戶縣氣溫數據:小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷最高氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫,正點氣溫≤最高氣溫,當違反規則時兩個參與的數據均為可疑,因為正點氣溫可疑,因此最高氣溫也可疑;人工審核時只針對了單一的最高氣溫要素,判斷為正確。對比兩種結果,計算機判斷是準確的。
1.3.3最低氣溫
在實時質量控制階段總共檢測出了50個錯誤和可疑數據。經過審核完全正確,正確率為100%。
1.3.4最大風向、風速
實時質量控制階段總共檢測出了31個錯誤和可疑數據。經過審核全部正確,風向和風速正確率都為100%。
1.3.5本站氣壓
實時質量控制階段總共檢測出了140個可以或錯誤數據。經過審核全部正確,正確率100%。
1.3.6相對濕度
實時質量控制階段總共檢測出了37個可疑或錯誤數據,全部正確,正確率100%。
通過比較發現,上述質量控制方法質控結果準確度高于傳統的人工質量控制方法,數據可信度較高。
2 結束語
進行自動站實時數據質量控制,可以保證資料使用者使用有質量保障的數據開展預報預測、天氣研究分析、氣候變化研究,以及資料服務等業務。氣象資料是氣象業務的基礎,使用正確的數據開展業務研究、應用,才可以得出正確的結論。利用計算機技術進行自動站實時數據質量,可以滿足實時氣象業務的需求。自動站實時數據,由于其數據及時性,在天氣實況監測方面,越來越受到業務人員的重視,已經成為天氣實況分析的重要數據來源,特別是在災害性天氣監測方面,自動站的優勢非常明顯。近年來信息技術及網絡技術飛速發展,計算機的性能和處理數據的能力越來越快,因此利用計算機技術,結合氣象探測資料質量控制規則,對自動站實時數據進行自動質量控制,可以迅速完成,保證數據時效。
參考文獻
[1]葉篤正,曾慶存,郭欲福.當代氣候研究[M].北京:氣象出版社,1991.211
[2]鞠曉慧,任芝花,張強.自動站小時氣壓的質量控制方法研究[J].安徽農業科學,2010,38(27):15130-15133.
[3]趙立成.氣象信息系統[M].北京:氣象出版社,2011:117-119.
[4]任芝花,熊安元.地面自動站觀測資料三級質量控制業務系統的研制[J].氣象,2007,33(1):19-24.
[5]劉小寧,任芝花.地面氣象資料質量控制方法研究概述[J].氣象科技,2005,33(3):199-203.
[6]熊安元.北歐氣象觀測資料的質量控制[J].氣象科技,2003,31(5):314-320.
[7]Barnes SL.A technique for maximizing details in numerical weather map analysis[J].J Appl Meteor,1964,3:396-409.
[8]劉小寧,鞠曉慧,范邵華.空間回歸檢驗方法在氣象資料質量檢驗中的應用[J].應用氣象學報,2006,17(1):37:-43.
[9]何志軍,封秀燕,何利德等.氣象觀測資料的四方位空間一致性檢驗[J].氣象,2010,36(5):118-122.
[10]陶士偉,仲躋芹,徐枝芳,郝民.地面自動站資料質量控制方案及應用[J].高原氣象,2009,28(5):1202-1209.
作者單位
陜西省氣象信息中心 陜西省西安市 710014endprint
日最小相對濕度 日定時相對濕度;10min平均風速 日最大風速;極大風速 最大風速
風向方位為“C”(靜風)時,風速 0.2m/s;極大風速 17.0m/s時,應有大風現象;有大風現象時,極大風速 17.0m/s
低云量 總云量;散輻射總量 總輻射總量;反輻射總量 總輻射總量
未通過內部一致性檢查的數據,QC碼標注為2,并不再進行其他檢查,但前提是保證與之相比較的數據QC碼為0。
1.2.5 時間一致性檢查
時間一致性檢查是利用觀測要素連續變化原理來檢驗觀測信息或觀測要素值的時間變化率,識別出不理想的突然變化,當要素資料超出一定時間內的變化范圍,則該資料視為可疑。時間一致性檢查的目的是檢驗觀測信息或觀測要素的時間變化率,識別出不理想的突然變化。它適用于高的時間分辨率,因為相鄰樣本的相關性隨著時間分辨率增加而加強。檢查判斷依據與樣本的時間分辨率有關。在實時質量控制階段主要進行連續2小時變率檢查,即將本時次的數據和上個時次的數據進行比對,超過設定閾值的數據確定為可疑數據。例如,下表是1小時氣溫和氣壓變化的時間一致性檢查中的一條規則。如表2所示。
為了避免將個別極端天氣的正常數據當做錯誤數據處理,未通過時間一致性檢查的數據,QC碼只標注為1,并繼續進行其他檢查。
1.2.6 空間一致性檢查
各氣象參數都具有一定的空間分布特點,根據這些空間分布特點及規律而進行的檢查,被稱之為空間一致性檢查。其有效性取決于觀測站網的密度和被檢參數與空間的相關程度。對于孤立的錯誤資料,空間一致性檢查是非常有效的一種質量控制方法。通常利用與被檢查臺站鄰近的臺站同一時間觀測的氣象要素值進行比較,或利用鄰近測站觀測值通過一定的插值方法計算出被檢查臺站的估計值,觀測值與估計值的比較來進行,主要方法有:Madsen-Allerupt方法和空間回歸檢驗法,有效鄰近站則規定為:與被檢站點的數據進行比較時,鄰近站數據應保證正確。而對于鄰近站點數量過少的臺站,則不進行空間一致性檢查(華山站由于海拔太高,不宜采用空間一致性檢查方法,也不成為任何站的參考點)。
為了避免將個別極端天氣的正常數據當做錯誤數據處理,未通過空間一致性檢查的數據,QC碼只標注為1,并繼續進行其他檢查。
1.2.7 綜合分析法
在完成以上質量控制檢查后,對未通過臺站極值檢查、時間一致性檢查和空間一致性檢查之一的數據的將繼續對這些數據進行綜合分析對比。若同一數據的三個QC碼之和為3,即以上三種質控檢查均未通過,則認為該數據錯誤,QC碼標注為2;若QC碼之和為2,空間一致性QC碼為1,則認為該數據錯誤,QC碼標注為2;若QC碼之和為2,但空間一致性QC碼為0,則認為該數據可疑,QC碼標注為1,這是因為空間一致性檢查的敏感度最好,又解決確定性問題,故在綜合分析是,空間一致性檢查的結果將給予較多的考慮權重;若QC碼之和為1,則認為該數據可以,QC碼標注為1。
1.3 數據質量控制結果分析
為檢驗經過上述質量控制方法軟件系統自動進行質控后結果的準確度,將2010年7月陜西省100個自動站的實時資料從數據庫中提取出來,采用原始人工質量控制方法再一次進行質量控制,并進行比較,計算機實時質量控制結果人工驗證結果為(以個別要素為例):
1.3.1正點氣溫
在實時質量控制階段總共檢測出了50個可疑和錯誤數據。經過人工審核,除2個可疑數據改為正確,其他數據質量控制碼均正確未變,正確率為96%。
比對兩個數據:
2010年7月2日14時戶縣氣溫數據:小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷正點氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫≤最高氣溫;人工審核時只針對了單一的正點氣溫要素,判斷為正確。對比兩種結果,計算機判斷是準確的。
2010年7月5日14時戶縣氣溫數據:小時正點氣溫36.9℃,小時最高氣溫23.1℃,小時最低氣溫缺測。同上,計算機判斷應該是準確的。
1.3.2最高氣溫
在實時質量控制階段總共檢測出了50個錯誤和可疑數據。經過人工審核,1個可疑數據改為正確,其他數據質量控制碼未變,正確率為98%。
比對所更改的數據:
2010年7月2日14時戶縣氣溫數據:小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷最高氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫,正點氣溫≤最高氣溫,當違反規則時兩個參與的數據均為可疑,因為正點氣溫可疑,因此最高氣溫也可疑;人工審核時只針對了單一的最高氣溫要素,判斷為正確。對比兩種結果,計算機判斷是準確的。
1.3.3最低氣溫
在實時質量控制階段總共檢測出了50個錯誤和可疑數據。經過審核完全正確,正確率為100%。
1.3.4最大風向、風速
實時質量控制階段總共檢測出了31個錯誤和可疑數據。經過審核全部正確,風向和風速正確率都為100%。
1.3.5本站氣壓
實時質量控制階段總共檢測出了140個可以或錯誤數據。經過審核全部正確,正確率100%。
1.3.6相對濕度
實時質量控制階段總共檢測出了37個可疑或錯誤數據,全部正確,正確率100%。
通過比較發現,上述質量控制方法質控結果準確度高于傳統的人工質量控制方法,數據可信度較高。
2 結束語
進行自動站實時數據質量控制,可以保證資料使用者使用有質量保障的數據開展預報預測、天氣研究分析、氣候變化研究,以及資料服務等業務。氣象資料是氣象業務的基礎,使用正確的數據開展業務研究、應用,才可以得出正確的結論。利用計算機技術進行自動站實時數據質量,可以滿足實時氣象業務的需求。自動站實時數據,由于其數據及時性,在天氣實況監測方面,越來越受到業務人員的重視,已經成為天氣實況分析的重要數據來源,特別是在災害性天氣監測方面,自動站的優勢非常明顯。近年來信息技術及網絡技術飛速發展,計算機的性能和處理數據的能力越來越快,因此利用計算機技術,結合氣象探測資料質量控制規則,對自動站實時數據進行自動質量控制,可以迅速完成,保證數據時效。
參考文獻
[1]葉篤正,曾慶存,郭欲福.當代氣候研究[M].北京:氣象出版社,1991.211
[2]鞠曉慧,任芝花,張強.自動站小時氣壓的質量控制方法研究[J].安徽農業科學,2010,38(27):15130-15133.
[3]趙立成.氣象信息系統[M].北京:氣象出版社,2011:117-119.
[4]任芝花,熊安元.地面自動站觀測資料三級質量控制業務系統的研制[J].氣象,2007,33(1):19-24.
[5]劉小寧,任芝花.地面氣象資料質量控制方法研究概述[J].氣象科技,2005,33(3):199-203.
[6]熊安元.北歐氣象觀測資料的質量控制[J].氣象科技,2003,31(5):314-320.
[7]Barnes SL.A technique for maximizing details in numerical weather map analysis[J].J Appl Meteor,1964,3:396-409.
[8]劉小寧,鞠曉慧,范邵華.空間回歸檢驗方法在氣象資料質量檢驗中的應用[J].應用氣象學報,2006,17(1):37:-43.
[9]何志軍,封秀燕,何利德等.氣象觀測資料的四方位空間一致性檢驗[J].氣象,2010,36(5):118-122.
[10]陶士偉,仲躋芹,徐枝芳,郝民.地面自動站資料質量控制方案及應用[J].高原氣象,2009,28(5):1202-1209.
作者單位
陜西省氣象信息中心 陜西省西安市 710014endprint
日最小相對濕度 日定時相對濕度;10min平均風速 日最大風速;極大風速 最大風速
風向方位為“C”(靜風)時,風速 0.2m/s;極大風速 17.0m/s時,應有大風現象;有大風現象時,極大風速 17.0m/s
低云量 總云量;散輻射總量 總輻射總量;反輻射總量 總輻射總量
未通過內部一致性檢查的數據,QC碼標注為2,并不再進行其他檢查,但前提是保證與之相比較的數據QC碼為0。
1.2.5 時間一致性檢查
時間一致性檢查是利用觀測要素連續變化原理來檢驗觀測信息或觀測要素值的時間變化率,識別出不理想的突然變化,當要素資料超出一定時間內的變化范圍,則該資料視為可疑。時間一致性檢查的目的是檢驗觀測信息或觀測要素的時間變化率,識別出不理想的突然變化。它適用于高的時間分辨率,因為相鄰樣本的相關性隨著時間分辨率增加而加強。檢查判斷依據與樣本的時間分辨率有關。在實時質量控制階段主要進行連續2小時變率檢查,即將本時次的數據和上個時次的數據進行比對,超過設定閾值的數據確定為可疑數據。例如,下表是1小時氣溫和氣壓變化的時間一致性檢查中的一條規則。如表2所示。
為了避免將個別極端天氣的正常數據當做錯誤數據處理,未通過時間一致性檢查的數據,QC碼只標注為1,并繼續進行其他檢查。
1.2.6 空間一致性檢查
各氣象參數都具有一定的空間分布特點,根據這些空間分布特點及規律而進行的檢查,被稱之為空間一致性檢查。其有效性取決于觀測站網的密度和被檢參數與空間的相關程度。對于孤立的錯誤資料,空間一致性檢查是非常有效的一種質量控制方法。通常利用與被檢查臺站鄰近的臺站同一時間觀測的氣象要素值進行比較,或利用鄰近測站觀測值通過一定的插值方法計算出被檢查臺站的估計值,觀測值與估計值的比較來進行,主要方法有:Madsen-Allerupt方法和空間回歸檢驗法,有效鄰近站則規定為:與被檢站點的數據進行比較時,鄰近站數據應保證正確。而對于鄰近站點數量過少的臺站,則不進行空間一致性檢查(華山站由于海拔太高,不宜采用空間一致性檢查方法,也不成為任何站的參考點)。
為了避免將個別極端天氣的正常數據當做錯誤數據處理,未通過空間一致性檢查的數據,QC碼只標注為1,并繼續進行其他檢查。
1.2.7 綜合分析法
在完成以上質量控制檢查后,對未通過臺站極值檢查、時間一致性檢查和空間一致性檢查之一的數據的將繼續對這些數據進行綜合分析對比。若同一數據的三個QC碼之和為3,即以上三種質控檢查均未通過,則認為該數據錯誤,QC碼標注為2;若QC碼之和為2,空間一致性QC碼為1,則認為該數據錯誤,QC碼標注為2;若QC碼之和為2,但空間一致性QC碼為0,則認為該數據可疑,QC碼標注為1,這是因為空間一致性檢查的敏感度最好,又解決確定性問題,故在綜合分析是,空間一致性檢查的結果將給予較多的考慮權重;若QC碼之和為1,則認為該數據可以,QC碼標注為1。
1.3 數據質量控制結果分析
為檢驗經過上述質量控制方法軟件系統自動進行質控后結果的準確度,將2010年7月陜西省100個自動站的實時資料從數據庫中提取出來,采用原始人工質量控制方法再一次進行質量控制,并進行比較,計算機實時質量控制結果人工驗證結果為(以個別要素為例):
1.3.1正點氣溫
在實時質量控制階段總共檢測出了50個可疑和錯誤數據。經過人工審核,除2個可疑數據改為正確,其他數據質量控制碼均正確未變,正確率為96%。
比對兩個數據:
2010年7月2日14時戶縣氣溫數據:小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷正點氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫≤最高氣溫;人工審核時只針對了單一的正點氣溫要素,判斷為正確。對比兩種結果,計算機判斷是準確的。
2010年7月5日14時戶縣氣溫數據:小時正點氣溫36.9℃,小時最高氣溫23.1℃,小時最低氣溫缺測。同上,計算機判斷應該是準確的。
1.3.2最高氣溫
在實時質量控制階段總共檢測出了50個錯誤和可疑數據。經過人工審核,1個可疑數據改為正確,其他數據質量控制碼未變,正確率為98%。
比對所更改的數據:
2010年7月2日14時戶縣氣溫數據:小時正點氣溫30.9℃,小時最高氣溫22.8℃,小時最低氣溫21.9℃。計算機自動控制時判斷最高氣溫為可疑值,判斷標準為最低氣溫≤正點氣溫,正點氣溫≤最高氣溫,當違反規則時兩個參與的數據均為可疑,因為正點氣溫可疑,因此最高氣溫也可疑;人工審核時只針對了單一的最高氣溫要素,判斷為正確。對比兩種結果,計算機判斷是準確的。
1.3.3最低氣溫
在實時質量控制階段總共檢測出了50個錯誤和可疑數據。經過審核完全正確,正確率為100%。
1.3.4最大風向、風速
實時質量控制階段總共檢測出了31個錯誤和可疑數據。經過審核全部正確,風向和風速正確率都為100%。
1.3.5本站氣壓
實時質量控制階段總共檢測出了140個可以或錯誤數據。經過審核全部正確,正確率100%。
1.3.6相對濕度
實時質量控制階段總共檢測出了37個可疑或錯誤數據,全部正確,正確率100%。
通過比較發現,上述質量控制方法質控結果準確度高于傳統的人工質量控制方法,數據可信度較高。
2 結束語
進行自動站實時數據質量控制,可以保證資料使用者使用有質量保障的數據開展預報預測、天氣研究分析、氣候變化研究,以及資料服務等業務。氣象資料是氣象業務的基礎,使用正確的數據開展業務研究、應用,才可以得出正確的結論。利用計算機技術進行自動站實時數據質量,可以滿足實時氣象業務的需求。自動站實時數據,由于其數據及時性,在天氣實況監測方面,越來越受到業務人員的重視,已經成為天氣實況分析的重要數據來源,特別是在災害性天氣監測方面,自動站的優勢非常明顯。近年來信息技術及網絡技術飛速發展,計算機的性能和處理數據的能力越來越快,因此利用計算機技術,結合氣象探測資料質量控制規則,對自動站實時數據進行自動質量控制,可以迅速完成,保證數據時效。
參考文獻
[1]葉篤正,曾慶存,郭欲福.當代氣候研究[M].北京:氣象出版社,1991.211
[2]鞠曉慧,任芝花,張強.自動站小時氣壓的質量控制方法研究[J].安徽農業科學,2010,38(27):15130-15133.
[3]趙立成.氣象信息系統[M].北京:氣象出版社,2011:117-119.
[4]任芝花,熊安元.地面自動站觀測資料三級質量控制業務系統的研制[J].氣象,2007,33(1):19-24.
[5]劉小寧,任芝花.地面氣象資料質量控制方法研究概述[J].氣象科技,2005,33(3):199-203.
[6]熊安元.北歐氣象觀測資料的質量控制[J].氣象科技,2003,31(5):314-320.
[7]Barnes SL.A technique for maximizing details in numerical weather map analysis[J].J Appl Meteor,1964,3:396-409.
[8]劉小寧,鞠曉慧,范邵華.空間回歸檢驗方法在氣象資料質量檢驗中的應用[J].應用氣象學報,2006,17(1):37:-43.
[9]何志軍,封秀燕,何利德等.氣象觀測資料的四方位空間一致性檢驗[J].氣象,2010,36(5):118-122.
[10]陶士偉,仲躋芹,徐枝芳,郝民.地面自動站資料質量控制方案及應用[J].高原氣象,2009,28(5):1202-1209.
作者單位
陜西省氣象信息中心 陜西省西安市 710014endprint