任建玲


摘 要隨著對氣候變化研究的重視以及極端天氣的增多,歷史氣象觀測記錄檔案的需求與作用凸顯。從20世紀70年代末至今,氣象部門投入大量人力、物力和財力,歷史氣象觀測記錄檔案的數字化取得了可喜成果。本文回顧了天津氣象觀測記錄檔案數字化的各個階段、產生的數字化產品、檔案數字化成果的應用,并對下一步工作進行了展望。
關鍵詞氣象 觀測記錄 檔案數字化 成果應用
氣象觀測記錄檔案是在氣象觀測、探測中形成的,反映大氣中各種氣象要素、大氣現象及其變化過程的真實記錄,包括各種觀探測記錄表、簿、磁帶(盤)、縮微膠片、光盤等[1]。氣象觀測記錄檔案是氣象檔案館的館藏主體,天津市氣象檔案館收藏了大量紙質載體的氣象記錄檔案,最早的記錄檔案始于1887年,是研究我國近代氣候及環境的不可替代的寶貴財富,也是區域氣候變化和全球變化研究的基礎資料。這些氣象記錄檔案主要以紙質載體為主,其信息無法得到更為廣泛和深入的應用,數字化是解決利用和保護最佳的方法。
歷史氣象資料數字化是指將紙質歷史氣象資料掃描成數字圖像,通過鍵盤錄入方式將紙質或數字圖像上的數據信息轉換為可編輯、處理的數據文件,通過光學字符識別或波形圖識別技術將數字圖像上的數據信息轉換為可編輯、處理的數據文件。對紙質歷史氣象資料進行數字化,既可以保護資料原件,維持其歷史憑證價值,又能突破原有載體提供利用時的局限性,提高歷史氣象資料的應用效率[2]。
一、氣象觀測記錄檔案數字化歷程
1.數字化初始階段(1978—1990)。始于20世紀70年代末期,按照中央氣象局的統一部署,天津氣候資料室開始使用紙帶穿孔方法對紙質地面氣象觀測記錄月報表進行信息化,用手工打鍵的方法,把手工記載的氣象資料變成電子計算機能接收識別的信息,記入紙帶、卡片、磁帶或膠片等信息載體上。參考依據就是1978年12月中央氣象局業務處下發《全國地面氣象資料信息化基本模式暫行規定》(中氣業發字〔1978〕第212號文)[3]1,之后又對這部分記載地面氣象觀測信息的紙帶資料進行了重新整理和錄入,轉換成了A0文件歸檔保存。A0文件作為重要的數字化氣象資料,為之后的各項氣象事業的發展提供了可靠的基礎數據資源。
2.數字化持續階段(1991—2008)。截至2008年之前,數字化工作持續進行。期間完成的主要工作有:(1)存貯介質轉存。中國氣象局預測減災司氣預函〔2006〕54號《關于做好2006年預測減災業務服務專項能力建設工作的通知》下達了“天津市歷史信息化氣象資料存貯介質轉存項目”。完成的主要任務是把2005年之前存檔的各站地面、農業氣象、輻射信息化資料,進行質量檢查并分別存放在可讀寫CD-ROM光盤、磁帶、在線服務器三種介質上。(2)降水自記紙跡線提取。降水自記紙是客觀記錄降水情況的珍貴氣象觀測資料,它記錄著每次降雨的特征,包括每分鐘的降雨強度、起止時間和各個時段的最大降水量,對我市開展降水特征和天氣、氣候的研究具有非常重要的意義,同時在防災、減災和國民經濟建設中發揮重要的作用。
按照中國氣象局氣預函〔2002〕83號文件《關于在全國開展國家基本(準)站降水自記紙數字化處理的通知》的要求,2003—2007年期間陸續完成了“天津市降水自記紙數字化處理”項目。利用中國氣象局氣象檔案館和廣東省氣候中心共同研究開發的“降水自記紙彩色圖形數字化處理系統”[4]737,依據中國氣象局統一下發的《降水曲線數據文件數據格式》《降水自記數據(降水強度)標準文件格式》,完成了天津市所轄范圍內兩個國家基本站自建站2004年降水自記紙圖像掃描、跡線跟蹤處理、質量檢查、數據轉換、數據集制作等工作。成果包含4713個圖像文件(*.jpg);4713個數據文件(*.zjr);2個分鐘強度數據文件(R1文件);2個分鐘標準數據文件(R01文件);2個小時標準數據文件(R60文件);2個圖像數據集;1個降水曲線數據集;1個降水強度數據集。降水自記紙數字化是紙質檔案數字化的一個大膽探索和實踐,為其他紙質檔案數字化提供了寶貴的經驗和技術借鑒。(3)補錄A6/V0文件。從2005年開始,開展國家科技基礎性工作專項資金項目“氣象科學數據共享中心”子項目“省級數據資源建設與共享服務”天津專題建設,通過對數字化歷史資料的格式檢查、質量檢查、數據統計,完成了大量數據集制作,并大大提高了數字化歷史資料(A0/A6)文件的質量。建立的數據集清單見表1。依托這個項目,天津按照《全國地面氣象資料A6、A7文件信息基本模式暫行規定》(中國氣象局預測減災司文件,氣預發字〔1999〕第14號)[3]29、氣表-1封面、封底V文件格式(中氣測發〔2001〕18號)[3]34的相關規定,對國家基本站自建站到2004年的地面氣象記錄月報表中逐時觀測項目進行人工錄入處理生成A6文件1500個、封底封面V0文件1500個,并通過合成軟件合并為A文件。(4)風自記歷史資料數字化。依托2008年開展的“天津市風能資源數據庫建設”項目,按照國家級項目統一要求和本市風能資源評價的需要,通過手工錄入和人機交互質量控制,完成全市四個參證站(塘沽、漢沽、大港、西青)建站至2008年12月的風向風速逐小時歷史資料數字化工作,建立格式統一、數據完整和質量可靠的AF文件1968個,為我市風能資源數據庫建設提供歷史背景資料。
3.數字化飛速發展階段(2009年至今)。2009年以來,天津市氣象檔案館在中國氣象局氣象監測與災害預警工程、氣候變化應對決策支撐系統工程、山洪地質災害防治氣象保障工程項目專項經費的持續支持下,委托數字化外包公司先后完成天津市國家級氣象臺站各類地面觀測記錄月報表、新中國成立前各類歷史氣象觀測資料、農業氣象觀測報表、高空氣象觀測記錄表、氣壓、溫度、濕度、降水、風向風速自記紙的圖像掃描和數據集制作。完成情況與數據量見表2(見下頁);數字化錄入文件數據集見表3(見下頁)。
2009年至2018年期間,取得了豐碩的數字化建設成果,這些成果已經在氣象業務和科研中得到應用,取得了顯著的成效。2019年的山洪地質災害防治氣象保障工程已安排經費,進行風自記紙跡線提取工作,目前正在進行中。
二、數字化成果應用
1.業務工作的支撐。歷史檔案數字化產品A系列文件,自20世紀70年代末誕生以來,一改數據人工抄錄和統計的歷史,在氣象事業發展過程中長期發揮著重要的支撐作用,服務氣象事業50年。數字化的檔案滿足了用戶對不同時空、分辨率數據的需求,也為預報預測、氣候監測、氣候分析與評估、農業氣象服務、人工影響天氣、應急與減災、氣象災害與防御等提供了重要的數據保障,促進氣象業務發展,獲得顯著的社會效益。可以負責任地說,每項氣象相關業務工作的開展都離不開歷史數據的支撐,離不開檔案的憑證和查考作用。
2.數據產品的基礎。為了更好地提供數據服務,我們制作了大量數據產品,數字化的檔案為各類數據集產品提供基礎數據源,數據產品囊括地面、高空、輻射等各類觀測,種類包括氣候標準值產品、基礎數據產品、氣候整編產品、均一化產品、網格化產品等。
3.科研和服務的保證。數字化的檔案為科學研究和氣象服務提供必要的資料保證,支持氣象科學研究項目462個,各級各類氣象服務不計其數。科研項目的資助來源包括國家科技部、中國氣象局、天津市科委、市發改委、市農委、市財政局、市技術監督局、市氣象局等,還有一些橫向合作的部門及高校。氣象服務遍及全社會各個角落,關系到國計民生,小到氣象災害憑證、大到重大事項決策。舉個最近的應用實例:2017年8月在天津召開的全國第十三屆全運會,從籌備到開幕閉幕日期的選擇,從綜合氣象條件分析到可能風險分析,從制定人工影響天氣方案到應急方案制定,很多決策都參考了氣象統計數據。我們提供的氣象數據有近30年氣候背景統計數據、4月到9月期間逐小時降水量數據、雷達基數據資料、歷史天氣圖等數字化資料。科研方面,氣候中心申請的天津市科技局項目“氣候變化對天津市排水規劃設計標準的影響評估”利用從降水自記紙提取的逐分鐘降水資料,分析了氣候變化對天津市排水設計的影響,分別利用年最大值法和年多值法進行了分區暴雨公式編制等。
4.服務基礎資料專項。2011—2013年各省開展的“基礎資料專項工作”,對地面、高空、輻射數字化資料存在的數據質量問題集中進行質量檢查,使其完整性、可靠性和準確性進一步提升。在質量檢查過程中,數字化檔案起到了關鍵作用。利用最多的各類報表,使用的是掃描形成的圖像文件數據集,完全不用人工從庫房中提取原始紙質檔案,節省了大量借閱、歸還的工作,并保護了珍貴原始觀測記錄檔案,工作效率提高70%。
三、數字化工作展望
1.新技術的應用提高效率。目前,氣象資料數字化工作主要采用圖像掃描技術、數據錄入技術、圖形提取技術等。其中,相對有難度、耗時較長的是自記紙類圖形跡線跟蹤技術,其過程主要是人機結合地對自記跡線進行跟蹤,得到跡線特征點的坐標數據,從而得到給定時間段內逐分鐘降水量數據,形成數據文件。相信未來會有更好的技術和手段來完成類似的工作,提高數字化效率。未來手寫文本也能很準確地進行OCR識別,也會大大提高手寫檔案的數字化效率。
2.建立更高時間分辨率要素序列。自動氣象觀測站自2003年開始在全國范圍內建立,自動觀測儀器可以采集到各種觀測要素的分鐘數據,而在此之前,我們僅能提供一天四次的定時觀測數據。隨著對暴雨洪澇災害、城市瀝澇、多年一遇極端降水事件分析等的深入研究,對更高時間分辨率降水資料的需求越來越突出。在需求的引領下,我們開展了降水自記跡線提取工作,得到自動站建立前的分鐘降水量數據,滿足了科研的需要。風的數據對風能資源開發、橋梁設計、高層建筑設計、大氣污染物擴散研究等起著至關重要的作用,因此長序列高時間分辨率風向風速觀測資料是2019年氣象科技檔案數字化的重點工作。以需求為引領,是數字化工作開展的依據。進一步加強氣溫、氣壓、相對濕度等要素的數字化力度,取得高時間分辨率氣象觀測數據,是今后繼續努力的目標。
3.提升歷史氣象資料數字化產品在線管理和服務能力。有了大量數字化產品,它的開發利用迫在眉睫。從檔案安全角度著想,我們自主研發了“歷史氣象觀測檔案數字化檢索平臺”。該系統在服務器虛擬化平臺上部署桌面虛擬化系統,在閱覽室部署瘦客戶機,完成歷史氣象觀測檔案數字化檢索平臺應用的桌面虛擬化實現。用戶可根據檔案分類和查詢習慣,實現在平臺上對歷史氣象觀測檔案的分類檢索和調閱,提高了歷史檔案的檢索效率。同時,系統的應用減少了對紙質檔案的翻閱,從而保護了檔案,降低了管理員工作強度,減少由于檔案移動引起的工作失誤;采用桌面虛擬化技術,實現了氣象檔案的安全訪問,防止了檔案未經授權的訪問事件發生。
“十三五”氣象信息系統發展規劃現代化目標明確提出,要提高數字化氣象檔案在線管理服務率,更便捷、高效、全面地提供長年代氣候背景數據產品。這也是我們近年來的工作目標,在中國氣象信息中心的領導下,逐步實現氣候資料數字化圖像在線查詢、檢索服務。