邱 超,何 錫 君,張 蘭
(1.浙江省水文管理中心,浙江 杭州 310027; 2.浙江省環境監測中心,浙江 杭州 310012)
水文要素種類繁多,包括雨量、水位、蒸發、流量、泥沙、水質、墑情和水溫等反映水文情勢的各類數據,一般由水文站網通過水文測驗獲取[1-2]。目前,浙江省水文部門已建成各類水文要素監測站點7 000多個,共享氣象和城管等部門雨量監測站4 000多個,全省站網密度達到9 km2/站。水文數據已逐漸呈現出多源、多維、大量和多態的大數據特征[3]。水文部門利用多源匯集的大量數據,歷年來為水利部門在防汛抗旱、水資源管理、水利工程建設、水生態修復等方面提供了全方位的服務。隨著機構改革和大數據時代的來臨,應急管理、自然資源、生態環境、氣象等其他政府部門以及社會公眾對水文部門的服務需求日益增長,充分利用人工智能、云計算等核心技術對海量數據進行管理、交換、共享、分析和應用成為當前的重要任務。而為各類型水文測站設計規律性代碼是標志、識別和融合應用多源數據以及建設水文大數據平臺的前提和支撐[4-5]。
隨著浙江省數字化改革的推進,數據歸集逐步多源整合,各部門無序編碼現象突出,氣象站、水情站、資料站等編碼各成體系,無法統一融合,阻礙了水文要素集成管理與綜合分析,導致數據使用效率低下[6]。現有水文測站編碼體系已經不能滿足當前跨行業跨部門站點的管理與應用需求,逐步暴露出一些應用問題:① 編碼攜帶的信息量較少、可兼容性和可拓展性不足。現有編碼僅包含流域水系、測站類型信息,缺少測站精確的空間位置信息,必須輔以其他信息才能準確定位,同時編碼無法兼容氣象、城管等部門的站點信息,無法實現以地理空間網格為對象的多監測要素信息融合,制約了水文信息網格分布式應用。② 編碼管理水平不高。近年來隨著浙江省水文測站數量的迅速增加,目前的人工編碼方式已經越來越不適合時代發展的要求:一方面人工編碼工作效率低;另一方面一站多碼、同站不同碼等錯誤情況時有發生,直接影響了水文數據的信息化進程。以GIS空間數據為技術框架,通過統一的數據模型和對象編碼,構建物理集中與邏輯映射相結合的數據庫群是一種有效解決方案[7],將地理空間區域劃分成地理網格對象,基于網格對象的時間序列來實現任意空間和時間序列的水文分析計算,為后期無資料地區、小流域水文分析及分布式水文模型研發奠定技術基礎。因此,研究一套具有高密度、唯一性和高集成性的地理網格空間水文測站編碼體系勢在必行,同時也符合當前浙江省數字化改革提出的各部門數據多源整合、共享共用的要求。
遵循GB/T 7027-2002《信息分類和編碼的基本原則與方法》中定義的科學性、系統性、可擴展性、兼容性與綜合實用性5項編碼原則[8],應盡量減少人為因素影響,本文提出基于地理網格的水文測站編碼方法,將水文站編碼與地理空間的自然屬性相關聯,根據站點屬性信息和地理網格自動進行測站編碼,有效提升了編碼的自動化和標準化水平。
地理網格是一種對地理空間進行位置劃分的方法,是將連續空間區域的平面離散化,即按一定規則進行分割,形成許多網格單元,并賦予標識符(即地理編碼)[9-10]。基于地理網格可以最大程度地匯集和共享網格內分布的各種海量信息資源,為區域信息獲取、處理和應用服務提供技術支撐。在多用戶、多平臺、多數據源的復雜異構環境下,以網格為對象的編碼方式可以實現數據高效共享和數據集成[11]。目前,地理網格技術在交通管理、農產品產地溯源等方面有著廣泛的應用,成果顯著[12-13]。
將地理網格技術引入到水文測站編碼中,可以將分散的各類水文要素信息,通過地理網格對象進行空間組織,實現基于地理網格對象的多要素存儲模式和應用體系。該編碼方法的總體思路為:采用規則網格預先對浙江省全域進行兩級分區,由基本網格和子網格組成為網格碼,網格碼結構為DrrrBcccTxx;再編制不同測站類型碼Kyy。網格碼與類型碼組合成測站編碼DrrrBcccTxxKyy。根據水文匯集測站的經緯度位置信息,采用自適應技術自動匹配至自動編碼的地理網格中,構建網格對象與站點的對照關系。總體目標就是以網格為對象整合集成當前分散的各類監測數據源,實現水文要素之間的關聯,為基于地理網格的水文大數據應用做好技術儲備。
1.2.1基本網格劃分
基本網格編碼采用組合代碼形式,將省域劃分為若干個方格狀的監測區,在經、緯度1°內劃分100個×100個的網格,每個網格跨度為0.01°,按自南向北、由西至東順序進行行列編碼,劃分后得到的每一個網格都具有一個唯一的地址編碼與之對應。該地址編碼由兩部分構成:網格所在的行號、網格所在的列號。其中行號的定義是:網格在水平軸延伸方向的行數,其中以起算點左下角網格為第1行。列號的定義是:網格在垂直軸延伸方向的列數,其中以起算點左下角的網格為第1列。基本網格編碼形式如下:DrrrBccc。其中,D表示東經,B表示北緯;rrr為3位,表示測站網格所在垂直軸方向的列號,由西至東順序編號為001~500;ccc為3位,表示測站網格所在水平軸方向的行號,自南向北順序編號為001~500。浙江省域測站基本網格編碼示例見圖1。

圖1 浙江省域測站基本網格編碼示例Fig.1 Coding of basic grid of gauges in Zhejiang Province
1.2.2子網格劃分
考慮到全省部分地區水文測站集中度較高,有進一步細分網格的需求,以及今后的拓展需求,在基本網格上進行子網格的劃分,即在基本網格的基礎上進一步劃分為10個×10個網格,子網格編碼形式如下:Txx。其中,T表示子網格拓展劃分;xx為2位,表示子網格所在基本網格劃分后的編號,為0N~NN。以基本網格D001B001為例,測站子網格編碼彈性劃分示例見圖2。針對可能存在部分站點距離較近的實際情況,在實際編碼拓展中,N值默認為9。

圖2 水文要素子網格編碼劃分示例Fig.2 Coding division of hydrological sub-element
1.2.3測站類型碼
根據測站當前主要開展的水文監測項目,制定水文測站類型碼,以便于水文測站按類型碼進行歸類。測站類型碼見表1。

表1 測站類型碼
考慮到測站種類和數量的需要,測站類型編碼形式為Kyy。其中,K表示測站類型分類;yy為2位,第1位y代表不同水文測站類型碼(表1),第2位y代表同類型監測站的數量(若存在多個同類監測站點,編碼取1~9;若不存在,編碼取0)。
1.2.4自適應編碼
利用站點經緯度位置信息,采用自適應技術自動匹配至測站的地理網格中,結合測站屬性信息,自動完成測站的地理網格編碼。針對水位、水質、墑情等各類已有測站編碼,建立唯一的關聯關系,實現以地理網格為單元匯集全部水文要素信息資源。地理網格編碼類似身份證號碼,現有各類測站編碼類似不同銀行卡卡號,通過關聯關系就可以實現對不同銀行卡的集中管理。地理網格編碼與原有測站關聯轉換關系示例見圖3。

圖3 水文測站地理網格編碼與原有測站關聯轉換示意Fig.3 Conversion between previous gauges and new geographical code grid
該編碼方案主要具有如下特點:
(1) 有利于數據交換和共享。采用基于地理網格的測站編碼,每一網格的編碼都是唯一確定的,網格內的信息高度集成,極大地方便了部門之間相關業務數據的交換和共享。
(2) 有利于數據應用和拓展。通過網格編碼提取網格內水文數據信息,為分布式洪水預報模型、水資源空間分析等水文業務在GIS條件下的應用和拓展提供了極大便利。
(3) 編碼根據站點空間及屬性信息可預先自動生成,且富有彈性,無需人為編輯,便于管理。編碼本身具有空間和屬性信息,方便分類統計,應用便捷、高效。
(4) 符合大數據發展趨勢。地理網格化正逐漸成為信息化業務系統的一個發展方向,本文采取的地理網格編碼可以為大數據分析應用奠定堅實的應用基礎。
雨量分析是水文分析計算的基礎,如區域降雨分析、水量分析計算、洪水預測預報以及汛情信息發布都需要有雨量時間和空間分析。隨著水文分析的深入,需要對歷史、實時和未來降雨進行融合分析。而采用傳統的基于站點的分析已無法滿足該分析要求,存在站網變動大、歷史站點數據應用困難、跨部門數據無法融合、空間分析精細化不夠等問題,通過采用以地理網格為對象的編碼體系,可較好地解決上述問題,并在流域洪水預報的時空演變分析中得到了較好的實踐應用。
基于歷史、實時和未來降雨進行分析和預報時,發現傳統的以站點為對象的分析方法無法有效利用所有采集要素,主要存在以下4方面問題。
(1) 歷史各年站點數據不統一。歷史水文數據序列長度不一,有長達百年之久的水文測站,也有5 a以內的水文測站,在進行序列分析時,針對站點進行分析,無法形成完整的水文序列。
(2) 參與統計分析站點變化較大。隨著大量站點建設及跨行業數據歸集,測站密度激增,站點故障和相鄰融合等問題凸顯,不同時間段可用于分析計算的站點會有較大差異,以點為對象統計分析存在不合理現象。
(3) 未來降雨與實時降雨格式不一致。未來數值降雨預報成果為網格對象數據,傳統實時降雨以站點為對象進行統計分析,格式無法兼容,須統一到基于站點或基于網格的格式進行降雨統計分析。
(4) 流域內的雨量時空分布無法精細化體現。以站點的點對象為基礎開展面雨量分析計算,受站點密度限制無法實現小區塊的面雨量空間分析,只能概化為大區塊的面雨量過程,時空分布無法精細化,影響預報精度。
為了精準掌控流域降雨時空演變態勢,該案例采用了基于地圖網格的水文測站編碼,將多源水文要素進行以網格為單元對象的空間地理編碼,實現站點從點到網格面的空間關系轉換,以便給予規則的網格面,可以按時間序列空間插補全域網格的數值,實現從網格面到全域面的時間序列空間賦值。結合水文分析的流域范圍,可以對全域面中的所有網格單元對象進行特定空間范圍的提取。提取后可以按照時間序列實現面雨量計算、等值面填色、籠罩面積統計等二次空間分析。分析過程如圖4所示。

圖4 全域面降雨時空演變分析示意Fig.4 Demonstration of rainfall tempor-spatial evolution in whole region area
每個網格都通過網格編碼實現對象化身份認證,并以網格編碼為索引進行存儲,通過開發接口實時動態調用任意時間段、任意網格數據。選定區域可以由一個子網格,也可以由任意多個子網格組成,結構靈活,并與未來數值降雨無縫對接,為水資源分區統計、水質水量同步分析、分布半分布等洪水預報模型的集成化應用提供了技術支撐。
地理網格編碼體系較好地實現了點源與網格數據格式、本省和歐洲預報模式的多源數值預報降雨耦合,實時在線比對多源流域面雨量成果,為錢塘江分布式水文模型提供了精準實效的實時和未來雨量數據。
錢塘江半分布式水文預報模型基于重點預報區域河流水系分段,將現有報汛的水工程和水文斷面作為劃分節點,構建產匯流網格與河流之間的匯流網絡模型。通過地理網格編碼體系為洪水作業預報平臺輸入高精度的網格化歷史和實況降水量數據等,通過參數率定模塊開展半分布式模型參數的率定。
2021年6月30日至7月2日,錢塘江中上游出現較強降雨過程。錢塘江半分布式水文預報模型于6月30日14:00,根據實況點降雨和未來數值降雨預報成果,開展實時作業預報。通過站點降雨網格化、統計實時和未來各分區面雨量過程、調用半分布式水文預報方案等流程,預報常山以上流域各子流域河流節點的洪水過程。其中流域出口斷面的常山水文站洪峰流量4 890 m3/s,實測洪峰流量5 060 m3/s,相較于集中式模型預報的洪峰流量4 370 m3/s,在預報精度和洪水過程擬合度方面都有明顯提高。通過采用地理網格編碼體系,將有利于進一步細化流域預報單元,實現從傳統集中式預報向分布式預報的發展,預報對象將逐步從固定斷面向區域內的任意網格單元拓展。
為了更好地實現對海量水文數據進行集成管理、分析、共享、應用和發布,結合水文信息的現代化服務需求,本文提出了基于地理網格的測站編碼方法,制定了網格編碼規則,建立了網格內各類測站編碼與網格編碼之間的關聯關系。上述成果實現了當前水文分析從點到面的跨越,打破了數據時空變化造成的融合壁壘,拓展了水文數據的深加工和分析服務能力,有利于水文大數據技術的應用和分析,為后續水文數字化服務提質增效奠定了堅實的基礎。