倪大銀 李鳳生 賴曉珍
淮河流域水利普查數據成果提取的方法研究
倪大銀1李鳳生2賴曉珍3
流域機構是水利普查的重要工作層面,在水利普查工作中承擔著大量工作,責任重大。形成流域水利普查數據成果是流域機構的主要工作之一,也是開展流域數據審核匯總工作的基礎。作為流域水行政主管部門,獲取和掌握這些極具價值的基礎水信息,將能夠更好地提升流域日常管理能力和水平。
全國水利普查實施方案的設計上有流域匯總這個階段,但未考慮流域成果匯總的方法,清查對象和部分普查對象缺少流域標記信息,給流域成果提取工作帶來困難。本文對流域水利普查數據的提取方法進行了探討和分析,并基于流域行政區劃成果,實現了流域水利普查成果數據的提取。該方法具有一定的通用性,可應用于其他流域級水利普查數據成果的提取。
流域各省上報國家和流域的數據成果分為兩類:一是普查業務數據,包括清查數據和普查數據,專用軟件的文件格式;二是空間數據成果,專用軟件加密后的電子地圖圖層集。
空間數據提取方法相對簡單,將解密后的空間數據圖層集,與流域基礎圖層,如水資源分區底圖,通過GIS(地理信息系統)軟件進行空間疊加運算分析,即可提取出流域的空間數據成果。
通常情況下,空間數據與水利普查數據一一對應,可將空間數據流域提取成果映射到普查表的數據提取。但由于存在標繪錯誤、流域邊界誤差、圖表數據不一致等問題,空間數據與表格成果不能很好對應,無法直接應用于水利普查數據成果的提取。
清查表和普查表都包含不同級別的行政區劃信息,普查對象所在行政區劃按不同專業分類,精確程度有所不同,分別精確到縣、鄉鎮和行政村級別。因此根據流域行政區劃成果,通過行政區劃代碼來建立流域范圍和清查、普查對象的關聯關系,是水利普查數據提取的有效技術路線之一。
對于部分有“所在水資源三級區”和“所在河流”等指標的對象,則可以精確進行流域識別和提取,保證了流域成果的準確性。
通過清查、普查對象的分析,結合數據字典內容,設定了水利普查數據的提取規則,盡可能利用對象的流域標識信息,提高數據提取的準確性;對于缺少流域標識的對象,則完全依賴行政區劃進行提取。普查對象的提取過濾條件及精確性分析見表1。
流域行政區劃成果是流域水利普查數據提取的基礎。為能及時編制完成流域行政區劃成果,早在2011年7月,淮委普查辦組織有關單位利用國普辦下發的行政區劃列表與淮委已有的1∶5萬地形圖(2006年成果)進行對照,提取流域行政區劃范圍的初步成果,形成了流域行政區劃范圍初稿并發送五省予以復核;根據各省反饋意見,進行了相應調整,形成了流域行政區劃范圍技術成果(修訂稿);經專家審查,進一步復核和完善后,2011年11月形成了《第一次全國水利普查淮河流域行政區劃范圍技術成果報告》。
2012年,在各省提交水利普查成果數據后,根據P701灌區面積表和P801規模以上機電井普查表,再次補充和完善了淮河流域行政區劃成果,進一步提高了成果的精確性。
數據提取依賴于水利普查成果基礎數據庫。將各省提交的數據成果,通過水利普查數據管理專用軟件導入到數據庫中,實現數據的還原。基于普查成果基礎數據庫,使用水利普查專用軟件和數據庫自身管理軟件可實現業務數據的提取。
普查空間數據因其特殊性,各省提交的數據是經專業軟件加密后的成果,需要進行相應的解密后方能使用。
水利普查清查成果缺少流域性標識,實現難度相對較大,而且缺少相應專用軟件的支持。考慮到簡單便捷性,清查成果提取僅在數據庫層面,通過SQL(數據庫結構化查詢語言)創建查詢視圖來實現。
提取過濾條件參照表1的提取條件,大部分對象依賴于流域行政區劃進行流域識別,少數對象可通過所在河流湖泊編碼進行精確提取。對于“所在河流(湖泊)編碼”有漏填的清查對象,為提高精度,結合行政區劃進一步篩選。

表1 淮河流域水利普查數據提取過濾條件表
視圖字段與數據管理系統中清查數據導出內容相一致,以便于各專業人員進行數據比對和審核。數據導出可借助第三方軟件工具,如PL/SQLDeveloper或ToadforOracle等軟件,一般導為EXCEL格式。實際使用中,后者功能更強大,可實現大數據量的EXCEL文件格式導出。
水利普查數據指標信息豐富,大部分對象都含有“所在水資源三級區名稱及編碼”字段。調用水利普查數據管理系統專用軟件的普查查詢功能,在水資源三級區名稱及編碼中輸入“E”,即實現了流域的數據提取。通過軟件的數據導出功能,輸出成EXCEL文件格式。同時,查找出水資源三級區編碼為空值的對象,結合行政區劃進一步判別。這種提取方式,能夠遍歷所有記錄,保證流域對象提取的完整性。
對于無法通過“水資源三級區編碼”的提取對象,通過關聯行政區劃編碼進行識別,技術實現方法與清查成果提取相似。
經解密后的空間數據為shapefile文件格式,通過ArcMap中ArcToolbox的空間分析工具,將各省空間成果數據與流域邊界數據進行相交疊加分析,即可實現各省空間數據流域提取。提取工作可以單獨對某個圖層進行操作,也可對多個圖層進行批量處理。各省提取的成果經協調合并后,形成流域空間數據成果。
對水利普查成果數據進行分析,提出切實可行的數據提取方法并加以實現。經初步比對分析,提取的流域成果與歷史資料基本一致。
部分對象只能根據行政區劃代碼進行判別,行政區劃的精度和準確性直接影響數據提取的準確性。現有流域基礎行政區劃精細到鄉鎮級,與流域自然區劃范圍存在細微差異,也就決定了這些對象只能提取近似精確的成果;少數普查對象如灌區,只能劃歸到縣,與實際情況有差別,后期還可結合空間數據作進一步識別。
以上流域清查、普查和空間數據成果可用來互相校驗,并已應用于水利普查數據匯總審核工作中。通過提取形成的流域水利普查成果,可進一步與常規統計資料對比,開展相關的數據分析。獲取的基礎信息和對比分析情況,將為流域日常業務和管理提供很好的數據支撐,進一步提升流域管理和服務能力
1.淮委水利普查領導小組辦公室 233001 2.淮委水文局(信息中心) 233001 3.淮河流域水資源保護局 233001)