曹伏天,劉朝功
(國(guó)家自然資源督察北京局,北京 100032)
2013年,國(guó)務(wù)院部署第一次全國(guó)地理國(guó)情普查工作。經(jīng)過(guò)7年多的發(fā)展,地理國(guó)情監(jiān)測(cè)工作進(jìn)入常態(tài)化階段,其成果應(yīng)用范圍也越來(lái)越廣泛。2017年,“三調(diào)”工作全面開(kāi)展。“三調(diào)”工作是國(guó)家根據(jù)社會(huì)發(fā)展和國(guó)民經(jīng)濟(jì)的需要,在2008年第二次全國(guó)土地調(diào)查基礎(chǔ)上,全面細(xì)化和完善全國(guó)土地利用狀況的一次全覆蓋土地調(diào)查[1-3]。為貫徹落實(shí)“三調(diào)”工作有關(guān)文件精神和工作要求,自然資源督察機(jī)構(gòu)緊緊圍繞“三調(diào)”成果數(shù)據(jù)的真實(shí)性,對(duì)提交的“三調(diào)”成果真實(shí)性開(kāi)展督察,督促地方嚴(yán)格落實(shí)責(zé)任,確保“三調(diào)”成果的準(zhǔn)確可靠。
在“三調(diào)”成果真實(shí)性督察工作的前期準(zhǔn)備中,督察機(jī)構(gòu)需要在短時(shí)間內(nèi)比對(duì)大量的“三調(diào)”成果數(shù)據(jù),提取出疑似問(wèn)題圖斑并進(jìn)行判讀和現(xiàn)場(chǎng)核查。按照往年督察工作的經(jīng)驗(yàn),疑似問(wèn)題圖斑的提取方法相對(duì)單一,借助ArcGIS、MapGIS等專(zhuān)業(yè)軟件或開(kāi)發(fā)定制的數(shù)據(jù)分析平臺(tái)比對(duì)各類(lèi)基礎(chǔ)與管理數(shù)據(jù),提取疑似問(wèn)題圖斑[4-5]。整個(gè)過(guò)程人工交互較多,流程固定且重復(fù),費(fèi)時(shí)費(fèi)力。
加拿大Safe Software公司推出的FME軟件,在空間和非空間數(shù)據(jù)處理方面特點(diǎn)鮮明,可以較好地整合督察業(yè)務(wù)涉及的多格式、多類(lèi)型數(shù)據(jù)。FME軟件可以實(shí)現(xiàn)將整個(gè)從輸入到寫(xiě)出的比對(duì)流程模塊化、簡(jiǎn)潔化,提高工作效率,減少出錯(cuò)情況,也降低了更新維護(hù)的頻率與成本,將所有重復(fù)操作交給計(jì)算機(jī)進(jìn)行自動(dòng)處理[6-7]。
本文根據(jù)地理國(guó)情監(jiān)測(cè)和“三調(diào)”的相似特點(diǎn)[8],借助FME平臺(tái),創(chuàng)新性地提出構(gòu)建自動(dòng)化比對(duì)模型。經(jīng)過(guò)實(shí)際工作的驗(yàn)證,督察效率實(shí)現(xiàn)了翻倍增長(zhǎng),為自然資源督察機(jī)構(gòu)比對(duì)疑似問(wèn)題圖斑提供了新思路和新方法。
地理國(guó)情監(jiān)測(cè)數(shù)據(jù)中的地表覆蓋數(shù)據(jù)按“所見(jiàn)即所得”的原則開(kāi)展調(diào)查監(jiān)測(cè),與“三調(diào)”數(shù)據(jù)在空間上存在對(duì)象可比性。2019年,地理國(guó)情監(jiān)測(cè)與“三調(diào)”初始調(diào)查同期開(kāi)展,具有調(diào)查時(shí)點(diǎn)可比性。通過(guò)比較地理國(guó)情監(jiān)測(cè)與“三調(diào)”工作的調(diào)查原則、技術(shù)標(biāo)準(zhǔn),發(fā)現(xiàn)兩者既有結(jié)果的統(tǒng)一性,又有合理的差異性。因此,本文提出可以合理利用兩類(lèi)成果數(shù)據(jù)的差異,作為“三調(diào)”成果真實(shí)性督察的參考靶區(qū),相比逐圖斑的“大海撈針式”篩查,該方法有助于提高發(fā)現(xiàn)問(wèn)題的精準(zhǔn)性和效率。本文按照督察重點(diǎn)關(guān)注地理國(guó)情監(jiān)測(cè)數(shù)據(jù)與“三調(diào)”數(shù)據(jù)的地類(lèi),制定了兩類(lèi)數(shù)據(jù)轉(zhuǎn)換的映射表,將“三調(diào)”數(shù)據(jù)的地類(lèi)與地理國(guó)情監(jiān)測(cè)數(shù)據(jù)的地類(lèi)分別關(guān)聯(lián)對(duì)應(yīng)[9-12]。地理國(guó)情監(jiān)測(cè)數(shù)據(jù)與“三調(diào)”數(shù)據(jù)主要地類(lèi)編碼對(duì)應(yīng)表如表1所示。

表1 地理國(guó)情監(jiān)測(cè)與“三調(diào)”主要地類(lèi)編碼對(duì)應(yīng)表
加拿大Safe Software公司基于“語(yǔ)義轉(zhuǎn)換”的概念,推出了一款數(shù)據(jù)處理與轉(zhuǎn)換的軟件產(chǎn)品FME(Feature Manipulate Engine,簡(jiǎn)稱(chēng) FME)。FME軟件通過(guò)在轉(zhuǎn)換過(guò)程中重構(gòu)數(shù)據(jù)的功能,實(shí)現(xiàn)超過(guò)250種數(shù)據(jù)格式(模型)的轉(zhuǎn)換,可以讀寫(xiě)、存儲(chǔ)和轉(zhuǎn)換各種空間數(shù)據(jù)。利用FME平臺(tái),可以直觀、有效地構(gòu)建數(shù)據(jù)處理模型,在大量的數(shù)據(jù)轉(zhuǎn)換處理過(guò)程中,可以在任一節(jié)點(diǎn)查看數(shù)據(jù),實(shí)時(shí)檢查并修改整個(gè)分析流程,最后高效、保質(zhì)地完成各種復(fù)雜的數(shù)據(jù)處理任務(wù)。
本文利用FME平臺(tái)制作并逐步完善59種差異圖斑類(lèi)型模型。前期利用第三次全國(guó)國(guó)土調(diào)查領(lǐng)導(dǎo)小組辦公室核查發(fā)現(xiàn)的錯(cuò)誤數(shù)據(jù),使用等距抽樣再人工核查的模式,進(jìn)行模型準(zhǔn)確率測(cè)試。后期納入第二次全國(guó)濕地資源調(diào)查、土地整治和歷年耕地等用地管理信息數(shù)據(jù),豐富交叉驗(yàn)證信息,根據(jù)測(cè)試結(jié)果調(diào)整閾值參數(shù),提高差異圖斑的精準(zhǔn)率。總體比對(duì)框架主要包括源數(shù)據(jù)輸入、數(shù)據(jù)預(yù)處理、比對(duì)與問(wèn)題歸類(lèi)、結(jié)果輸出4個(gè)部分,如圖1所示。完成總體比對(duì)框架搭建后,將框架封閉到循環(huán)模型,最終實(shí)現(xiàn)自動(dòng)處理目標(biāo)數(shù)據(jù)流。

圖1 總體比對(duì)框架
為了實(shí)現(xiàn)比對(duì)流程的自動(dòng)化,便于前期的測(cè)試和后期的模型更新維護(hù),本研究需要通過(guò)設(shè)置一個(gè)或多個(gè)參數(shù),讓參數(shù)控制變量,達(dá)到修改一個(gè)或多個(gè)參數(shù)就可以調(diào)整整個(gè)模型的目的。不同的參數(shù)設(shè)置可以實(shí)現(xiàn)不同的目的,例如:設(shè)置輸入輸出參數(shù),可以實(shí)現(xiàn)相同格式、不同數(shù)據(jù)源的數(shù)據(jù)輸入和相同格式、不同路徑的成果輸出;設(shè)置條件參數(shù),實(shí)現(xiàn)比對(duì)后不同類(lèi)型、不同難易問(wèn)題的篩選;設(shè)置屬性值參數(shù),可以控制屬性?xún)?nèi)容等。通過(guò)在FME充分設(shè)置這些參數(shù),可以使自動(dòng)化程度達(dá)到較好的地步,實(shí)現(xiàn)不同督察業(yè)務(wù)的個(gè)性化定制。
本文共設(shè)置了輸入輸出的路徑參數(shù)、條件控制參數(shù)和面積閾值參數(shù)等29個(gè)參數(shù)。
坐標(biāo)系是地理信息行業(yè)最重要的基礎(chǔ),所有地理數(shù)據(jù)的比對(duì),第一步就要核對(duì)坐標(biāo)系,確認(rèn)各數(shù)據(jù)的投影帶是否相同。雖然“三調(diào)”成果數(shù)據(jù)全部采用2000國(guó)家大地坐標(biāo)系,但地理國(guó)情監(jiān)測(cè)數(shù)據(jù)及其他管理類(lèi)數(shù)據(jù)的坐標(biāo)系并不一致。為了統(tǒng)一輸入輸出的數(shù)據(jù)坐標(biāo)系或投影,避免因源數(shù)據(jù)坐標(biāo)系或投影的差異和可能存在的幾何錯(cuò)誤導(dǎo)致的數(shù)據(jù)不匹配或錯(cuò)位問(wèn)題,本文借助FME軟件完備的坐標(biāo)系庫(kù)和強(qiáng)大的轉(zhuǎn)換功能,在FME Workbench中提供的Reprojector和GeometryValidator兩個(gè)轉(zhuǎn)換器(FME軟件中的所有操作都需要通過(guò)代表不同功能的不同類(lèi)型轉(zhuǎn)換器得以實(shí)現(xiàn)),對(duì)輸入的地理數(shù)據(jù)進(jìn)行重新投影和幾何特征糾正,保證輸入的數(shù)據(jù)具有一致的空間坐標(biāo)系,避免在比對(duì)中產(chǎn)生誤差,影響分析結(jié)果。
數(shù)據(jù)預(yù)處理后,利用AreaOnAreaOverlayer轉(zhuǎn)換器對(duì)數(shù)據(jù)進(jìn)行比對(duì)。由于地理國(guó)情監(jiān)測(cè)數(shù)據(jù)和“三調(diào)”數(shù)據(jù)存在縣級(jí)矢量范圍不一致的情況,本文去除范圍外未疊加的無(wú)效部分,根據(jù)比對(duì)結(jié)果默認(rèn)字段overlaps篩選出疊加地塊。隨后,需要對(duì)地類(lèi)疊加時(shí)產(chǎn)生的細(xì)小、狹長(zhǎng)的地塊進(jìn)行去除,利用AttributeManager和CircularityCalculator轉(zhuǎn)換器計(jì)算狹長(zhǎng)率(長(zhǎng)度/面積)和圓度值,通過(guò)TestFilter轉(zhuǎn)換器調(diào)用條件參數(shù),篩選并去除狹長(zhǎng)的圖斑,再通過(guò)Aggregator轉(zhuǎn)換器根據(jù)疊加后的保留字段(字段可自由選擇),對(duì)“三調(diào)”圖斑內(nèi)的同一類(lèi)差異地塊進(jìn)行合并,之后借助AreaCalculator或AttributeManager轉(zhuǎn)換器計(jì)算合并后的面積,再利用Test轉(zhuǎn)換器調(diào)用面積參數(shù)去除面積較小的圖斑。
根據(jù)往年督察比對(duì)經(jīng)驗(yàn),本文首先確定了59種問(wèn)題類(lèi)型。借助字段管理AttributeManager轉(zhuǎn)換器,在數(shù)據(jù)屬性中建立一個(gè)問(wèn)題類(lèi)型字段,利用其中的條件判斷功能,區(qū)分問(wèn)題圖斑類(lèi)型,對(duì)屬性進(jìn)行賦值,問(wèn)題類(lèi)型賦值如圖2所示。然后,按照督察任務(wù)方案,進(jìn)一步細(xì)化差異圖斑與問(wèn)題類(lèi)型,同時(shí)利用土地整治數(shù)據(jù)、歷年耕地?cái)?shù)據(jù)和第二次全國(guó)濕地資源調(diào)查數(shù)據(jù)對(duì)“三調(diào)”成果數(shù)據(jù)進(jìn)行二次交叉驗(yàn)證。

圖2 問(wèn)題類(lèi)型賦值
比對(duì)后形成疑似問(wèn)題成果,選擇所需要的輸出格式,F(xiàn)ME軟件支持常見(jiàn)的SHP、GDB、MDB等地理空間數(shù)據(jù)格式無(wú)損輸出。本文基于前一步所建立的問(wèn)題類(lèi)型字段,利用輸出中的Fanout Dateset功能,對(duì)結(jié)果數(shù)據(jù)進(jìn)行扇出,界面如圖3所示。這樣扇出的好處在于無(wú)需對(duì)不同類(lèi)型問(wèn)題及不同縣(市)的數(shù)據(jù)進(jìn)行再次篩選和分割操作,直接進(jìn)行精分析及專(zhuān)項(xiàng)核查。同時(shí),使用StatisticsCalculator轉(zhuǎn)換器對(duì)問(wèn)題數(shù)量、問(wèn)題面積等進(jìn)行統(tǒng)計(jì),可以輸出Excel格式的成果文件,省去再利用Excel等相關(guān)軟件進(jìn)行統(tǒng)計(jì)匯總的分析操作。

圖3 結(jié)果扇出
整個(gè)框架中數(shù)據(jù)的輸入輸出、問(wèn)題類(lèi)型的判斷、問(wèn)題面積的篩選等關(guān)鍵環(huán)節(jié)都由參數(shù)控制,這些參數(shù)設(shè)置就是通過(guò)修改參數(shù)而達(dá)到修改整個(gè)模型的目的,但是所有參數(shù)本身需要人工輸入。因此,我們需要對(duì)變化的參數(shù)進(jìn)行輸入設(shè)計(jì)。本文在FME Workbench中重新建立了一個(gè)工作空間,輸入一個(gè)Excel文檔,文檔包含所有變化的參數(shù)(未變化部分的參數(shù)可不列舉),使用WorkspaceRunner轉(zhuǎn)換器,連接到前面的整個(gè)比對(duì)流程工作空間,為已經(jīng)設(shè)計(jì)好的比對(duì)框架包一個(gè)“殼”,形成一個(gè)簡(jiǎn)單的循環(huán),如圖4所示。這樣做的目的就是將設(shè)計(jì)好的整個(gè)流程封閉起來(lái),不斷對(duì)變化的參數(shù)賦值,讓機(jī)器按流程循環(huán)比對(duì),最終實(shí)現(xiàn)自動(dòng)化比對(duì)的目的。

圖4 循環(huán)體系
國(guó)家自然資源督察北京局將以往內(nèi)外業(yè)結(jié)合的工作方式轉(zhuǎn)變?yōu)槿珒?nèi)業(yè)核查加遠(yuǎn)程舉證,確保疫情期間的督察工作取得預(yù)期成果。內(nèi)業(yè)過(guò)程通過(guò)建立差異圖斑比對(duì)模型,實(shí)現(xiàn)了比對(duì)流程自動(dòng)化、過(guò)程模塊化的預(yù)期目標(biāo)。
經(jīng)過(guò)前期測(cè)試,在所有數(shù)據(jù)準(zhǔn)備齊全的情況下,半個(gè)小時(shí)可以完成一個(gè)擁有5萬(wàn)個(gè)“三調(diào)”圖斑的華北五省份的區(qū)(縣)全部比對(duì)工作,4個(gè)小時(shí)可以完成北京或天津市全部比對(duì)工作。同時(shí),生成差異圖斑和對(duì)應(yīng)的統(tǒng)計(jì)結(jié)果。駐點(diǎn)督察與實(shí)地核查完成后,從形成的督察成果看,利用此技術(shù)方法所發(fā)現(xiàn)的問(wèn)題占全部發(fā)現(xiàn)問(wèn)題的73.1%,效率較往年提高了2.04倍,“三調(diào)”督察最終發(fā)現(xiàn)的問(wèn)題圖斑數(shù)量占核查圖斑數(shù)量的8%,初步實(shí)現(xiàn)了精準(zhǔn)督察的目標(biāo)。
督察信息化一直都是自然資源督察的實(shí)現(xiàn)目標(biāo)。本文主要介紹了督察數(shù)據(jù)自動(dòng)化分析的思路,借助FME軟件通過(guò)設(shè)置多個(gè)參數(shù)控制比對(duì)流程,再將建立的比對(duì)流程封閉到循環(huán)中,通過(guò)輸入一個(gè)文檔對(duì)所有的參數(shù)進(jìn)行控制,最終形成自動(dòng)化的比對(duì)模型。本文探討了一種將大量重復(fù)、簡(jiǎn)單變化的地理信息數(shù)據(jù)比對(duì)操作交給計(jì)算機(jī)的技術(shù)方法,在時(shí)間有限的情況下,可以利用多臺(tái)設(shè)備進(jìn)行同步處理,在較短時(shí)間內(nèi)提供所需的疑似問(wèn)題結(jié)果。
本文模型比對(duì)的差異問(wèn)題質(zhì)量取決于地理國(guó)情數(shù)據(jù)質(zhì)量、“三調(diào)”數(shù)據(jù)質(zhì)量及模型參數(shù)設(shè)置等多個(gè)因素,不具有地域普適性。今后的應(yīng)用還需要探索如何消除技術(shù)路線(xiàn)中存在的“客觀誤差”。下一步的研究將會(huì)根據(jù)不同的業(yè)務(wù)種類(lèi),增加不同的管理類(lèi)數(shù)據(jù)、專(zhuān)項(xiàng)調(diào)查類(lèi)數(shù)據(jù),通過(guò)細(xì)化問(wèn)題類(lèi)型等工作提高模型的穩(wěn)定性,高質(zhì)量地完成不同類(lèi)型的自然資源督察業(yè)務(wù)保障工作。