鐘艷雯 朱亮 夏正龍 朱宏武 歐陽計躍












摘要:“天擎·湖南”的區域站降水分鐘數據存在多個獲取途徑且數據不完全相等,測試選取了不同來源、不同數據頻次、相同數據頻次的3組降水數據,使用Bland-Altman、數值比較等方法,檢測了天擎中不同來源的降水分鐘數據一致性及完整性,為數據的應用提供參考與依據。結果顯示所有接口小時數據完全一致,逐小時累加值與日值完全一致;分鐘數據大部分樣本值處于95%置信區間內,一致性較好,但是達不到完全一致。數據完整性僅有第二組完整性良好。
關鍵詞:降水1;一致性2;Bland-Altman3;天擎4
中圖分類號:TP311 ? ? ? ? ?文獻標識碼:A
文章編號:1009-3044(2022)05-0028-04
準確的降水資料對于氣象業務至關重要,目前中國氣象局氣象建立了大數據云平臺(“天擎”)為氣象部門提供統一數據服務,天擎提供的降水數據中包括了分鐘級降水數據,高頻次、低時延的分鐘級降水數據對于預報預警、防災減災作用尤為明顯,同時也是業務應用與大氣科學深入研究的基礎。但是分鐘降水數據存在與小時數據、日值數據不一致情況。多位學者或從地面氣象測報業務軟件、降水測量儀器、風場變形與微量降水等方面對降水誤差進行分析與處理研究 [1-5],或是通過將測站降水與TRMM估測降水、衛星、雷達等對比進行評估校驗 [6-8]。但是基于氣象大數據云平臺進行的降水一致性研究還較少。
2020年12月湖南省氣象大數據云平臺即“天擎·湖南”(以下簡稱天擎)正式上線投入業務試運行。天擎為用戶提供了統一、便捷的數據服務,同時還提供兼容接口,保障使用CIMISS(全國綜合氣象信息共享平臺)接口的業務應用平滑過渡、無縫對接。但是在使用過程中發現天擎接口、天擎兼容接口(以下簡稱兼容接口)的區域站降水分鐘數據存在多個獲取途徑且數據不完全相等,因此本文選取了同一時段同一站點不同來源、同一時段同一來源同一站點不同數據頻次、同一時段同一來源同一站點同一數據頻次3組降水數據,對天擎的湖南省區域站降水數據進行一致性分析。
1 數據與方法
1.1 數據選取
按照國際慣例,氣象觀測數據采用協調世界時(UTC),因此本文涉及的數據樣本時間為UTC。降水量單位為mm,取一位小數[9-10]。時間選取原則為時間段在某日00時00分至次日00時00分之間,并且該時間段內有降水值。數據選取原則為分鐘數據無長時間缺測;小時數據與日值數據無缺測、無更正報且質控碼為正確。
對比參照數據為進行了質量控制的區域站1小時降水數據與08-08時降水量日值數據。小時降水來源為天擎接口SURF_CHN_MUL_HOR(中國地面逐小時資料)PRE_1h(過去1小時降水量)要素值;日值降水來源為天擎接口SURF_CHN_MUL_DAY(中國地面日值資料)的PRE_Time_0808(08-08時降水量)要素值。
1.2 數據對比
1) 不同來源對比
本組測試選取天門山站點(P1801)2021年8月12日00時至8月13日00時天擎接口與兼容接口降水數據進行對比, 測試不同數據來源不同接口的數據一致性。兼容接口無SURF_CHN_MUL_MIN(中國地面分鐘數據),因此進行4組樣本的對比。
樣本1:逐小時降水量,來源為兼容接口SURF_CHN_MUL_HOR(中國地面分鐘數據),要素名:PRE_1h。
樣本2:逐分鐘降水量1小時累加,來源為兼容接口SURF_CHN_PRE_MIN(中國地面分鐘降水實時資料),要素名:PRE,每小時數量:60。
樣本3:逐5分鐘降水量1小時累加,來源為天擎接口SURF_CHN_MUL_MIN(中國地面分鐘數據),要素名:PRE,每小時數量:12。
樣本4:逐分鐘降水量1小時累加,來源為天擎接口SURF_CHN_PRE_MIN(中國地面分鐘降水實時資料),要素名:PRE,每小時數量:60。
逐小時降水值與對應時次的分鐘累加降水值如下:
2) 不同數據頻次對比
本組測試選取馬跡塘鎮百樂村站點(P2842)2021年8月24日00時至8月26日00時降水數據進行對比,測試不同數據頻次的數據一致性。
樣本1:逐5分鐘降水量1小時累加,來源為天擎接口SURF_CHN_MUL_MIN(中國地面分鐘數據),要素名:PRE,每小時數量:12。
樣本2:逐分鐘降水量1小時累加,來源為天擎接口SURF_CHN_PRE_MIN(中國地面分鐘降水實時資料),要素名:PRE,每小時數量:60。
3) 相同數據頻次對比
銅官站點(P5114)已經實現了1分鐘觀測數據接入,本組測試選取天擎接口該站點2021年8月12日00時至8月13日00時、8月24日00時至8月25日00時降水數據進行對比,測試同一數據頻次的數據一致性。
樣本1:逐分鐘降水量1小時累加,來源為天擎接口SURF_CHN_MUL_MIN(中國地面分鐘數據),要素名:PRE,每小時數量:60。
樣本2:逐分鐘降水量1小時累加,來源為天擎接口SURF_CHN_PRE_MIN(中國地面分鐘降水實時資料),要素名:PRE,每小時數量:60。
2 結果分析
2.1 一致性
Bland-Altman法是近年來在定量數據一致性評價方面得到廣泛認可的方法之一,它將一致性界限的定量分析與散點圖分布的定性描述相結合, 能夠直觀地定量和定性地考察數據間的一致性。以下分析圖中橫坐標為參照值與樣本的均值,縱坐標為參照值與樣本的差值。Mean為差值的均值,差值的±1.96倍標準差(±1.96*SD)之間為置信區間[11-13]。
一致性測試方法為:剔除無降水時次后,使用Bland-Altman法對小時降水量與對應時次60分鐘累加降水量進行一致性檢驗;以日值為參照值與24小時累加降水量、1440分鐘累加降水量進行對比。
1) 不同來源對比
由上圖可見樣本1與參照值完全一致,樣本2-4均有偏倚值,樣本2、4一致性較好。11個時次中,小時降水一致性:參照值=樣本1>樣本4>樣本2>樣本3。
日值與逐小時累加值、分鐘累加值對比結果如下:
由測試結果可見日值與逐小時累加值完全一致,日值與分鐘累加值樣本2、3、4均有偏差,其中與樣本3偏差較大。一致性:參照值=樣本1>樣本2>樣本4>樣本3。
2) 不同數據頻次對比
由上圖可見樣本1、2均有不一致值;樣本1完全一致率僅有9.1%,在降水較大時偏倚較大。22個時次中,小時降水一致性:樣本2>樣本1。
日值與逐小時累加值、分鐘累加值對比結果如下:
由測試結果可見日值與逐小時累加值完全一致,日值與分鐘累加值樣本1、2均有偏差,其中與樣本1偏差較大。一致性:參照值=天擎小時降水>樣本2>樣本1。
3) 相同數據頻次對比
由上圖可見樣本1、2均有不一致值;29個時次中,小時降水一致性:樣本2>樣本1。
日值與逐小時累加值、分鐘累加值對比結果如下:
12日日值數據為29.6與天擎小時降水、樣本2累加值相等,13日為142.6,與天擎小時降水累加值相等、與分鐘累加值樣本1、2均有偏差。一致性:參照值=天擎小時降水>樣本2>樣本1
2.2 完整性
完整性計算公式為:
S=(∑X/∑Y)*100%
其中,S為完整率,X為樣本實際數量,Y為樣本應收數量。各組測試結果如下:
3 結論與應用
3.1 結論
1)所有接口小時數據完全一致,逐小時累加值與日值完全一致。分鐘數據大部分樣本值處于95%置信區間內,一致性較好,但是達不到完全一致。不僅兼容接口分鐘降水數據與天擎接口分鐘降水數據不完全一致,天擎接口之間的分鐘降水數據也不完全一致。總體一致性逐分鐘降水高于逐5分鐘降水。
2)數據完整性僅有第二組完整性良好。其中天擎接口SURF_CHN_MUL_MIN(中國地面分鐘數據)分鐘數據缺失較多。
3)綜合比較結果,天擎接口SURF_CHN_PRE_MIN(中國地面分鐘降水實時資料)的分鐘降水數據一致性、完整性較好。
4)由于兼容接口僅提供最近10天的分鐘降水數據,天擎接口僅在2021年7月5日之后能獲取31站1分鐘的降水數據,同時要綜合考慮降水、缺測、質控、更正等因素,樣本的選取范圍受到一定限制。本研究還需要大量的、長序列的數據對結果進行進一步驗證。
3.2 應用
分析結果已應用于湖南省氣象業務內網平臺(簡稱內網平臺)中。內網平臺在計算任意時段分鐘降水累加時盡量使用小時或日值數據替換對應時次的分鐘降水值以提高準確性;同時在降水數據展示與分析時,結合每個要素的質控碼,提供“正確”“可疑”及“錯誤”數據質量組合選項,滿足用戶在總結匯報、形勢分析、預警發布等不同的應用場景的需求。以天門山站點為例,8月12日00時00分至13日00時00分的分鐘累加降水、小時累加降水、08-08時日值降水均為103.3mm,詳見圖10。
本研究檢測了天擎中不同來源的降水分鐘數據一致性,為降水分鐘數據的應用提供參考與依據,同時希望研究成果能夠助力分鐘降水數據的完整率、可用率的提高,依托“天擎·湖南”提供更加客觀、準確的高質量地面氣象觀測數據。
參考文獻:
[1] 丁善文,王玉河,朱霞.OSSMO軟件數據維護中降水不一致現象分析與處理[J].山東氣象,2013,33(2):36-38.
[2] 吳宜,劉西川,張軍,等.Parsivel激光雨滴譜儀與雨量計觀測降水的一致性分析[J].氣象科技,2020,48(2):147-153.
[3] 何純麗,肖斌.自動站降水誤差存在的原因和處理方法的探討[C].廣西氣象學會2014年學術年會.廣西氣象學會, 2014.
[4] 李娜,李毅,張文萍.湖南省降水量觀測誤差分析及其校正[J].水電能源科學,2017,35(2):21-23,57.
[5] 譚玉坤.降雨資料一致性檢驗實例計算分析[J].科技創新與應用,2016(3):223.
[6] 羅布堅參,翟盤茂,假拉,等.西藏高原測站降水與TRMM估測降水一致性評估[J].氣象,2015,41(9):1119-1125.
[7] 楊星,王永前,劉志紅.四川省2013年夏季衛星降雨數據的對比研究[J].高原氣象,2016,35(4):1039-1049.
[8] 李雁,張樂堅,梁海河,等.天氣雷達與地面自動站降水觀測一致性校驗分析[J].氣象科技,2013,41(3):436-442.
[9] 中國氣象局.地面氣象觀測規范[M].北京:氣象出版社,2003.
[10] 中國氣象局監測網絡司.氣象信息網絡傳輸業務手冊[M].北京:氣象出版社,2006.
[11] 寧錚美.Bland-Altman分析法在兩種化學發光儀器一致性評價上的應用案例[J].運動精品,2018(2):52-54.
[12] 萬毅,潘峰,楊喆,等.自動血壓計測量值一致性評估方法的應用[J].醫療衛生裝備,2010,31(1):17-18,24.
[13] 朱令宇,李永杰,張蒙生,等.Bland-Altman法在煙草測量儀器一致性評價中的應用[J].中國儀器儀表,2009(5):82-84.
【通聯編輯:梁書】
收稿日期:2021-08-24
基金項目:湖南省氣象局2017年氣象業務內網平臺項目
作者簡介:鐘艷雯(1976—),女,廣西柳州人,高級工程師,碩士,研究方向為氣象信息技術應用;朱亮(1986—),女,湖南雙峰人,高級工程師,碩士,研究方向為氣象信息技術應用;夏正龍(1980—),男,江蘇省建湖人,高級工程師,碩士,研究方向為氣象信息技術應用;朱宏武(1978—),男,湖南常德人,高級工程師,博士,研究方向為氣象數據處理;歐陽計躍(1970—),女,湖南冷水江人,高級工程師,學士,研究方向為氣象信息技術應用。