劉 霄,趙曉莉,王 凌
(1.四川省氣象探測數據中心(四川省氣象檔案館),成都 610072;2.高原與盆地暴雨旱澇災害四川省重點實驗室,成都 610072;3.四川省氣象災害防御技術中心,成都 610072)
氣象臺站元數據,亦即氣象臺站歷史沿革信息,它是氣象觀測記錄數據的重要背景信息,是了解、管理和應用氣象數據所必需的基礎信息。氣象臺站的臺站位置、測場環境以及使用的觀測儀器、觀測時制、觀測規范等要素總會隨著時代發展而發生變化,這些因素的變化會直接影響氣象觀測結果,影響氣候資料的非均一性。對氣象臺站這些相關信息進行采集、分析、查證、組織,形成規范而系統的可用數據,對于科研人員分析長序列歷史數據中的異常數據有很大的幫助,借此可以進行氣候資料非均一性檢驗和訂正,排除因臺站遷移、環境變化、設備換型、觀測規范變化導致的數據突變,避免錯誤分析。正因為如此,世界氣象組織和許多國家都十分重視氣象臺站歷史沿革信息的收集、存檔和利用,這些歷史沿革信息也成為國際間氣象數據交換所必要提供的元數據重要內容之一。由于種種原因,截至2010 年,我國氣象臺站歷史沿革信息尚未完全數字化,缺乏完整性、系統性和連續性。為適應氣象數據管理現代化和數據共享服務的需要,2011 年,中國氣象局預報與網絡司啟動了包括地面氣象臺站元數據文件(以下簡稱LD 文件)整編在內的“基礎氣象資料發展與改革專項”。
四川省LD 文件整編,嚴格按照氣象行業標準QX/T 37—2005 《氣象臺站歷史沿革數據文件格式》技術要求,對分布于紙質臺站檔案、地面觀測各種紙質記錄簿、年月報表、自記紙、地面觀測要素數字化數據文件(A 文件)、業務管理文件中的地面氣象臺站沿革信息進行梳理、采集、分析、查證和組織,形成完整的LD文件,并經過全面、系統、嚴格的質量控制后建立了完整的高質量的LD 文件數據集(建站以來,2.0 版),滿足了氣象業務、科研、服務和氣象數據交換等應用需求。
LD 文件設計為20 個項目(見表1),實際編制為17 個項目,設預留項目3 個,具有一定的可擴展性。主要由臺站名稱、區站號、臺站級別等項目構成,每一項內容的歷次變化都要在元數據文件中有所體現,形成1 條或多條記錄,每條記錄都由若干組數據組成。能在相關檔案資料中查閱到明確記載的,需要照實記錄;信息有疑誤的,按查證后的正確結果記錄;信息不明確的,則用相應的標示符予以標示。

表1 氣象臺站元數據文件內容構成
四川省LD 文件整編項目源自2003 年的中國氣象局“氣象科學數據共享”項目和2010 年中國氣象局“基礎氣象資料發展與改革專項”。
項目由國家氣象信息中心統一組織,四川省氣象檔案館具體承擔項目實施。項目任務下達后,四川省氣象檔案館根據任務書要求,成立項目小組,項目小組成員主要由長期從事地面氣象報表審核、檔案管理人員組成,檔案館館長任組長親自抓組織抓落實。為保證按期保質完成項目任務,開工前項目小組認真學習了行標要求,對相關紙質檔案和數字化資源進行了詳細了解,然后分解工作任務,制定考核標準,有組織有計劃地推進。整項工作投入近20 人,歷時近10 個月。
項目共完成167 個地面站(含10 個滿5 年撤銷站,本文以其中159 站為主要資料來源進行分析)LD文件的初編、修改、追加和新編。過程中查閱地面氣象記錄月報表(氣表-1)等紙質報表18 種、降水等自記紙5 種、紙質臺站檔案630 冊、地面氣象觀測要素數字化數據文件(A 文件)159 個、各類報表掃描圖像文件30萬個,從中梳理、采集、分析、查證臺站沿革各項有關信息,對記載不規范的原始信息進行規范化處理,嚴格按照QX/T 37—2005《氣象臺站歷史沿革數據文件格式》格式和流程形成完整的臺站元數據文件。編制流程見圖1。

圖1 臺站元數據文件編制流程
為確保LD 文件質量,滿足氣象業務和科研對數據質量的精準需求,編制前先出臺標準規范再組織整編,然后對所有LD 文件以軟件檢查和人工審核相結合的方法進行全面、系統的質量控制。
2.3.1 標準規范先行,保證元數據文件的規范性
為適應氣象數據管理現代化建設和數據共享服務的需要,中國氣象局于2005 年組織技術力量研究和設計了一套實用可行的行業標準QX/T 37—2005 《氣象臺站歷史沿革數據文件格式》,從內容、結構、格式等方面對LD 文件整編予以規范并進行了業務培訓。此后各省的LD 文件整編及國家氣象局臺站元數據質檢軟件研發都是基于該行業標準,保證了LD 文件整編和質檢的規范性和高效率。
2.3.2 質檢軟件助力,保證元數據信息的完整性
臺站元數據質檢軟件是依據氣象行業標準QX/T 37—2005 研制而成,主要對LD 文件進行完整性檢查、格式檢查和質量檢查,包括時間一致性檢查、內容一致性檢查和數據檢索結果檢查。若檢查出要素項目缺少,即按照該標準進行補報和更新。格式檢查完成后進行質量檢查,主要結合A 文件進行質量控制,并與A 文件相互訂正,若檢查出元數據文件與A 文件在經緯度、觀測場海拔高度、風儀高度等方面相矛盾,則自動生成備注文件以備人工核查,此備注文件隨臺站元數據文件一起歸檔保存。
2.3.3 人工核查把關,保證元數據信息的準確性
人工核查主要是對軟件審核的疑誤信息和錯誤信息進一步核實,對于容易判斷的錯誤信息即時予以更正,對于不易辨明的疑誤信息予以合理解釋(見圖2),作為備注信息亦隨臺站元數據文件一起歸檔保存。對一些自由格式內容寫法的規范性進行檢查,確定內容是否屬實、合理,提出修改指導性意見。通過對LD 文件的質量控制,也發現和糾正了歷史報表和記錄數據文件中的一些錯誤,起到了質量反哺作用。

圖2 質檢疑誤信息的人工核查記錄
LD 文件的質量控制主要通過國家氣象局和省氣象局兩級單位協調互動實現,如表2 所示,其過程包括“一審、二改、三查”,直到錯誤信息全部修正無誤、疑誤信息全部進行合理說明,符合要求后才予以定稿。

表2 氣象臺站元數據質量控制過程及結果
2.3.4 實時追加更新,保證元數據信息的適用性
2011—2013 年實施的“基礎氣象資料發展與改革專項”建立了氣象臺站元數據實時追加與更新機制,自2014 年開始,每年通過氣象資料業務系統(MDOS)實時將氣象臺站元數據信息追加更新至上一年度,以確保業務和科研應用到最新最完整的LD 文件。
從表2 可以看出,經過國、省兩級互動的“一審、二改、三查”質量控制過程,四川省LD 文件疑誤數、疑誤率、修改疑誤數、修改率均大幅降低,特別是疑誤數從1 209 條減少至63 條,減量為1 146 條,減幅為94.8%。修改率降低也十分明顯,且無法修改的疑誤信息均能進行合理的解釋。可見,元數據的質量已顯著提高。綜觀項目來源、組織管理、數據來源、質控手段和過程,四川省LD 文件的質量可信度較高。
通過“基礎氣象資料發展與改革專項”,形成了完整的四川省LD 文件集合,豐富了四川省氣象檔案編研產品,為地面氣候資料分析和非均一性檢測訂正提供了必要的背景信息,為開展四川省乃至中國氣候資料序列時間和空間均一性的影響研究、為建立地面氣象觀測要素均一化氣候序列,近百年均一化氣溫、降水時間序列等項工作奠定了堅實的基礎,經濟效益和社會效益十分明顯。
四川省LD 文件總體質量是好的,但因各種原因,也存在一些不可避免的問題與不足,還需要在以后的工作中進一步完善,并通過制度建設,加強管理,以彌補遺珠之憾。
在編寫臺站周圍障礙物一項(06 項)時。主要參考文獻《臺站檔案》,而此文獻中記載的障礙物的方位、名稱、仰角、寬度角、距離等項目多為1983 年的情況,造成各臺站建站至1983 年這段時間臺站周圍障礙物的分布情況不詳。
早期個別臺站經緯度及海拔高度未經過精確測量,大都為約測值,從而造成臺站經緯度和海拔不精準,因而站址信息不夠準確。
部分臺站個別年限某些氣象要素觀測所用的儀器設備名稱、距地或距平臺高度不明,由于年代久遠,參考文獻有限,一些儀器的變更情況無從查證。
從表3 可以看出,四川省159 個氣象站LD 文件01—19 項總變化次數48 931 次,而對觀測記錄非均一性影響程度前三位(見圖3)的臺站遷移(05 項)、臺站環境(06 項)和觀測儀器(08 項)變化次數都較大,其中遷站768 次,約占總變化數的1.6%,平均每站遷站次數為4.8 次;臺站環境變化1 942 次,約占總變化數的4%,平均每站變化12.2 次;觀測儀器變化28 941 次,占所有項目變化總數的59.1%,平均每站變化182 次。

圖3 氣象臺站沿革信息對觀測記錄非均一性影響程度[5]

表3 對觀測記錄非均一性影響較大項目的變化情況
LD 文件整編,是為了滿足國際間氣象數據交換和國內氣候資料分析、研究的迫切需要而開展的一項的編研活動,它順應了氣象數據管理現代化和數據共享服務的時代需要,有著極為重要的現實意義和深遠的歷史意義。編研工作是檔案利用工作的一個重要組成部分,是檔案部門系統、廣泛地向社會提供利用服務的一種更有效方式,它可以直接服務于業務、科研和社會各項事業,有助于推動和促進地方人文歷史、社會科學的研究。大數據時代檔案編研工作面臨更多機遇和挑戰,氣象檔案工作者應順應時代潮流、轉變觀念、強化能力,做到編研合時,常編常新,開發出更多氣象檔案編研精品,不斷激活氣象檔案價值,持續提升氣象檔案工作影響力,積極推動氣象檔案事業向前發展。
四川省LD 文件整編,涉及包括撤銷站在內的地面臺站167 個,記錄數近7 萬條,查閱各種氣象記錄掃描圖像文件30 余萬個,質檢過程中檢索A、V/Y 文件近萬條,形成檢索記錄6 800 余條,質控“三查”中檢查疑誤記錄4 100 余條,補充、修正各項變化記錄信息356組,規范化處理原始記錄信息79 組。臺站元數據文件的編報、質檢、修改都充分發揮了計算機和應用軟件等信息技術的巨大作用,否則單靠人工來完成,其難度無法想象。檔案治理時代的來臨,要求檔案人在不斷更新專業知識的同時,努力掌握更多的信息技術。
新中國成立以來,各省氣象部門曾先后幾次對氣象臺站沿革信息進行了收集整理,形成了1965 年、1983 年和2006 年三個版本的臺站檔案,在氣象事業發展過程中發揮了很大的作用,但也有其不足之處:沿革信息登記不夠齊全也不夠及時,部分信息不夠準確,同一內容記錄在不同載體中還存在一些矛盾,這些都給LD 文件整編帶來不小困惑,徒增很多時間和人力成本。此次“基礎氣象資料發展與改革專項”不僅形成了較為完整的LD 文件數據集,而且建立了臺站元數據信息實時追加制度,確保了后續信息采集的齊全、完整、及時、準確。為確保這項工作長期持續向好,不斷提高LD 文件質量,一方面,業務主管部門應建立長效機制,加強對相關單位業務考核;另一方面,業務單位應通過MDOS 平臺及時登記氣象臺站元數據備注紀要信息,尤其是要重點登記對觀測記錄非均一性影響程度較大項目的變化信息,杜絕再為后人留下記錄不全、不準的遺憾;再者,檔案管理部門要加強數據入庫監督,與主管部門和相關單位建立良性互動關系,協同促進氣象臺站元數據按要求及時入庫。
從表3 可以看出,08 項觀測儀器總共變化了28 941次,占所有項目總變化次數的59.1%,可見觀測儀器變化情況在LD 文件整編中的重要地位。觀測儀器的頻繁變動,直接影響氣象記錄的不連續性,進而影響到氣候資料的均一性,張智等人認為觀測儀器的變化是今后元數據追加的主要內容,是有道理的。新中國氣象事業從無到有,從弱到強,從傳統人工觀測到現代化自動探測,儀器設備都扮演了重要角色,是重要的見證物,它承載了豐富的信息內容。加強儀器設備檔案(包括儀器實物)的收集保管,規范儀器設備信息的記錄,不僅對分析研究氣候資料的非均一性具有重要意義,而且對建設氣象史館、展示氣象事業發展成就和氣象文化、開展氣象科普教育也具有不可替代的重要價值。
LD 文件整編過程中,難點之一就在于散存于各種氣象檔案載體中的元數據信息存在不齊全、不準確、不規范、不一致(多種記錄載體中的信息不統一)現象,給整編人員帶來諸多困惑。這種問題通過查找相關文獻資料,咨詢臺站發展相關參與人、知情人得到了最大程度的解決。一部分參與人、知情人在整編過程中通過回憶和講述釋疑、解惑、糾錯,發揮了積極作用。不僅如此,他們還承載了當地氣象事業發展史的其他豐富記憶,是一筆寶貴財富,但他們正在慢慢老去,其經歷和記憶也會逐漸模糊甚至喪失,當下開展口述氣象史料建設顯得尤為必要和迫切。
據整編后對全省159 個地面臺站LD 文件進行統計,自建站至2011 年臺站位置實際變動768 次,其中有2 個站遷站次數最多均達7 次,5 個站遷站分別達6次;遷站距離≤2 000 米的163 次,2 000<距離≤10 000米的50 次,距離>10 000 米的22 次。近年來,隨著四川省城鎮化的加快發展,遷站次數有上升趨勢,2011—2016 年,又發生臺站遷移37 次,且遷移距離較遠,新舊站址環境差異較大。臺站的頻繁遷移對氣候資料均一性的影響顯而易見。因此,氣象部門要加大氣象執法力度,加強各類氣象臺站長期保護,力保氣象臺站持續穩定運行,尤其是要全力保護好目前探測環境較好的氣象臺站,同時新遷站址要有百年以上的安定意識。檔案部門亦應順應時代需要積極開展百年氣象站專題檔案資源收集與整理,滿足用戶對檔案信息資源的一站式利用需求。
氣象臺站元數據是氣象觀測記錄的重要背景信息,臺站元數據的規范化建設既是一項重要的日常業務工作,而且還是氣象檔案工作的重要組成部分。四川省LD 文件整編工作扎實有效,但同時也存在一些難以避免的問題和不足,給氣象業務工作和氣象檔案工作都帶來了許多有益啟示。在氣象業務全面自動化和檔案管理時代走向檔案治理時代之際,我們應順勢而為,積極做好臺站元數據的規范化建設和全過程管理,做到收齊、管好、用活,為了解、管理、應用氣象數據提供可靠、可信的基礎背景信息。