張聰娥(陜西省氣象信息中心,西安 710014)
陜西省歷史高空氣象觀測記錄表數字化成果
張聰娥
(陜西省氣象信息中心,西安 710014)
簡要介紹了“陜西省歷史高空氣象觀測記錄表數字化處理”工作的內容、成果,并對成果數據集、文件結構進行了簡要介紹,旨在使資料管理者和使用者及時了解氣象檔案數據結構,提高資料檢索能力和資料使用效率;最后指出了本次數字化資料存在的問題,以供使用者參考和后續資料整編修正。
數字化;掃描圖像數據集;錄入文件數據集;陜西
氣象資料數字化處理是將紙介質歷史資料轉為電子介質信息,以實現氣象資料的電子檢索和利用。由于年代長、保存條件差和PC-1500計算機打印質量等問題,許多高空觀測記錄表紙張已經出現不同程度的變質,字跡嚴重變淡、變模糊,這些原始觀測資料急需盡快拯救和保護。目前,國家氣息信息中心已對館藏的高空氣象觀測記錄月報表(高表-1、高表-2)進行了數字化掃描和數字化錄入,而各省(區、市)氣象檔案館館藏的歷史高空氣象觀測記錄表高表-11、高表-12、高表-13、高表-14、高表-16還沒有進行信息化處理,因此,中國氣象局啟動了《氣候變化應對決策支撐系統工程》—“近代器測歷史氣候資料拯救和數字化子系統”項目,要求對歷史高空氣象觀測記錄表進行數字化處理。陜西省2012年5月—2013年9月開展“陜西省歷史高空氣象觀測記錄表數字化處理”工作,對西安(涇河)、延安、漢中、安康、洛川5個高空探測站1954—2010年高表-11、高表-12、高表-13、高表-14、高表-16等高空觀測記錄表進行數字化掃描,對1957—2010年07時和19時高表-12、高表-13中從地面~5 hPa規定等壓面風資料進行數字化錄入,并對所有掃描的圖像文件和錄入的數據文件進行了認真全面的質量檢查。本文簡要介紹成果數據集、文件結構,使資料管理者和使用者及時了解氣象檔案數據結構,提高資料檢索能力和資料使用效率。
“陜西省歷史高空氣象觀測記錄表數字化處理”工作主要形成以下數字化成果:高空觀測記錄表掃描圖像文件數據集(見表1)、高空觀測規定等壓面風錄入文件數據集(見表2)。

表1 陜西省高空觀測記錄表圖像文件數據集清單

表2 陜西省高空規定等壓面風錄入文件數據集清單
2.1 高空觀測記錄表掃描圖像文件數據集
該數據集提供高空風向風速、壓、溫、濕等原始探測數據,由若干圖像文件組成,每頁記錄表對應一個文件。當需要原始探測數據時可檢索該數據集里的文件,調閱對應觀測記錄表圖像。
經緯儀小球測風觀測記錄表(高表-11)掃描圖像文件數據集提供規定高度層風向、風速等原始探測數據;探空球測風觀測記錄表(高表-12)掃描圖像文件數據集、雷達測風觀測記錄表(高表-13)掃描圖像文件數據集、雷達單獨測風觀測記錄表(高表-16)掃描圖像文件數據集提供規定高度、規定等壓面層風向、風速等原始探測數據。文件名為“UPAR_WEW_xx_MUL_FTM_GBnn_JPG_IIiii_YYYYMMDD_TTz.jpg”,其中“UPAR_WEW”、“MUL_FTM”、“JPG”為固定碼;“xx” 為省區標識符,陜西省為SN;“GBnn”為高表類別代碼,nn取11、12、13、16時分別表示高表-11、高表-12、高表-13、高表-16;“IIiii”為區站號(如延安為53845);“YYYYMMDD_TTz”為記錄表年(4位)、月(2位)、日(2位)、時(北京時,2位)、頁碼(1位)。例如:文件UPAR_WEW_SN_MUL_FTM_GB11_JPG_53845_19580101_191.jpg表示延安1958年1月1日19時小球測風觀測記錄表第1頁;探空觀測記錄表(高表-14)掃描圖像文件數據集提供規定等壓面層、特性層、零度層及對流層頂高度、壓、溫、濕等原始探測數據。文件名為UPAR_WEA_xx_MUL_FTM_GB14_JPG_IIiii_YYYYMMDD_TTz.jpg ,其中“UPAR_WEA”、“GB”為固定碼,其余含義同上。如UPAR_WEA_SN_MUL_FTM_GB14_JPG_53845_19580101_072.jpg表示延安1958年1月1日07時探空觀測記錄表第2頁。
2.2 高空觀測規定等壓面風錄入文件數據集
該數據集提供規定等壓面層高度、風向、風速等數字化數據,由若干文本文件組成,每月對應一個文件。當需要數字化資料時可檢索該數據集里的文件,打開對應文件讀取數據。
文件名為“GAAF-IIiii-YYYYMM.TXT”,簡稱GAAF文件(GAAF表示高空觀測規定等壓面層風),“IIiii”、“YYYY”、“MM”分別為區站號、年份、月份。例如,文件GAAF-53845-195803.TXT表示延安1958年3月規定等壓面風錄入文件。
GAAF文件由臺站參數、風資料數據和文件結束符組成。臺站參數是文件的第一條記錄,共5組占一行,從左至右分別為區站號、測風海拔高度、測站類別和探測次數、年份、月份;風資料數據分時次(先07時后19時)按日期升序錄入。每日數據記錄包括探測時間、各層(地面~5 hPa)數據兩部分。探測時間為一組,共8位占一行;各層數據排列規則為:每層5組數據占一行,從左至右分別為氣壓、位勢高度、時間、風向、風速,根據等壓面層數順序錄入。每日數據記錄以“,”結束,月最后一日記錄以“=”結束,文件以“######”結束。
(1) B01文件是包含規定等壓面風資料的數據集,是最有比對性的參照數據源。利用“高空數據錄入質量檢查軟件”對1981—2010年規定等壓面風錄入數據進行質量檢查時主要采用“與B01文件對比檢查”這一檢查方法,而1957—1980年無B01文件,所以對這一段錄入數據進行質量檢查時由于沒有參照數據,“與B01文件對比檢查”這一關鍵檢查無法進行,錄入數據中存在的一些潛在錯誤可能沒有及時發現。
(2)1957—1968年高表-11和高表-12交替使用頻繁,承擔高空觀測記錄表數字化的公司錄入人員不熟悉記錄表格式,有些時次高表-11的風資料被誤錄入。由于高表-11是用規定等壓面的平均高度而非實測高度計算出來的風資料,數據缺乏代表性,但時間緊、任務重,這些錯誤還未得到糾正,以致這部分數字化資料缺乏真實性和可信度。
以上問題有待在今后資料整編、資料服務以及業務、科研使用過程中繼續修正和完善。
張聰娥.陜西省歷史高空氣象觀測記錄表數字化成果[J].陜西氣象,2014(2):36-38.
1006-4354(2014)02-0036-03
2014-01-07
張聰娥(1963—),女,陜西戶縣人,工程師,從事高空氣象資料、報表審核。
中國氣象局重點建設項目“氣候變化應對決策支撐系統工程”
B