沈向前,余 洋
(1.武漢大學(xué) 遙感信息工程學(xué)院,湖北 武漢 430079)
地理國(guó)情普查是一項(xiàng)重大的國(guó)情國(guó)力調(diào)查,是掌握地表自然、生態(tài)、經(jīng)濟(jì)、人文基本情況的基礎(chǔ)性工作,對(duì)全面獲取地理國(guó)情信息、掌握經(jīng)濟(jì)社會(huì)發(fā)展和自然資源環(huán)境狀況有著重要的意義[1-5]。精準(zhǔn)、詳實(shí)的地理國(guó)情數(shù)據(jù)是地理國(guó)情普查后期統(tǒng)計(jì)分析、監(jiān)測(cè)評(píng)價(jià)、統(tǒng)籌決策的基礎(chǔ)。因此,地理國(guó)情普查的質(zhì)量控制是地理國(guó)情普查生命力的保障。內(nèi)業(yè)數(shù)據(jù)的質(zhì)量檢查貫穿地理國(guó)情普查生產(chǎn)實(shí)施的全過程,關(guān)系到質(zhì)量控制的成敗[6]。
內(nèi)業(yè)更新生成的地表覆蓋分類數(shù)據(jù)和地理國(guó)情要素?cái)?shù)據(jù)中存在的質(zhì)量問題大致可分為規(guī)則不符錯(cuò)誤和屬性判斷錯(cuò)誤兩類。規(guī)則不符錯(cuò)誤主要是數(shù)據(jù)不符合采集要求或數(shù)據(jù)達(dá)不到采集指標(biāo);屬性判斷錯(cuò)誤主要是地物分類錯(cuò)誤或地物屬性信息錯(cuò)誤。對(duì)這些質(zhì)量問題,目前檢查的方法有程序自動(dòng)檢查、人工對(duì)照檢查、人機(jī)交互檢查3種。復(fù)雜環(huán)境下(山區(qū)或圖版破碎)的質(zhì)檢問題是當(dāng)前研究的一個(gè)弱點(diǎn),這些地區(qū)的解譯會(huì)產(chǎn)生識(shí)別錯(cuò)誤、位置不準(zhǔn)確、表示困難等錯(cuò)誤,采用單一檢查方法并不能有效地進(jìn)行質(zhì)量檢查。確定具體問題的最優(yōu)檢查方法,形成優(yōu)化質(zhì)檢方案,可提高檢查效率,有效控制復(fù)雜環(huán)境下內(nèi)業(yè)數(shù)據(jù)的質(zhì)量。
1)程序自動(dòng)檢查。通過設(shè)計(jì)模型算法和編制計(jì)算機(jī)程序,利用空間數(shù)據(jù)的圖形與屬性、圖形與圖形、屬性與屬性之間存在的邏輯關(guān)系和規(guī)律,檢查發(fā)現(xiàn)數(shù)據(jù)中存在的錯(cuò)誤。該方法的優(yōu)點(diǎn)是:①檢查用時(shí)短,效率高,可以進(jìn)行批量檢查;②節(jié)省人力資源,能加快項(xiàng)目進(jìn)度;③能夠檢查肉眼難以分辨的錯(cuò)誤,不容易出現(xiàn)漏檢、錯(cuò)檢,檢查結(jié)果定位準(zhǔn)確。其缺點(diǎn)是:① 很難對(duì)非結(jié)構(gòu)化、主觀性強(qiáng)的質(zhì)量問題進(jìn)行檢查;②需要購(gòu)買或自行研發(fā)質(zhì)檢軟件,且需要對(duì)質(zhì)檢人員進(jìn)行質(zhì)檢軟件的使用培訓(xùn)。
2)人工對(duì)照檢查。通過人工檢查核對(duì)實(shí)物、數(shù)據(jù)表格或可視化的圖形,以此判斷檢查內(nèi)容的正確性。該方法是地理國(guó)情普查內(nèi)業(yè)質(zhì)量控制的重要方法,其優(yōu)點(diǎn)是:①適用范圍廣,基本上所有類型的錯(cuò)誤問題都可用人工對(duì)照的方法進(jìn)行檢查;②對(duì)于普查過程中新制定的質(zhì)量要求(指標(biāo))也能很好地檢查;③ 不需要購(gòu)買或自行研發(fā)質(zhì)檢軟件。其缺點(diǎn)是:①檢查用時(shí)長(zhǎng)、效率低,且隨著檢查時(shí)間的拉長(zhǎng),檢查人員會(huì)出現(xiàn)視覺疲勞等問題,進(jìn)一步降低檢查效率;②容易出現(xiàn)檢查遺漏、檢查錯(cuò)誤等現(xiàn)象。地理國(guó)情普查要采集的要素種類繁多,內(nèi)業(yè)編輯的質(zhì)量要求和指標(biāo)也多種多樣,大范圍的人工對(duì)照檢查會(huì)不可避免地出現(xiàn)錯(cuò)漏現(xiàn)象。
3)人機(jī)交互檢查。利用程序?qū)⒂幸牲c(diǎn)的地方搜索出來,縮小范圍或精確定位,再采用人機(jī)交互檢查方法,由人工判斷數(shù)據(jù)的正確性。對(duì)于一些能夠用程序檢查、但需要人工確認(rèn)的質(zhì)量問題,采用人機(jī)交互檢查方法,是對(duì)程序自動(dòng)檢查和人工對(duì)照檢查的補(bǔ)充。
在明確數(shù)據(jù)質(zhì)量要求、數(shù)據(jù)組織及成果歸檔要求的基礎(chǔ)上,依據(jù)《地理國(guó)情普查檢查驗(yàn)收與質(zhì)量評(píng)定規(guī)定》的要求[7],確定內(nèi)業(yè)質(zhì)量檢查流程,如圖1所示。
1)檢查面表征質(zhì)量,主要包括面折刺檢查、面邊界回頭線檢查、最小上圖面積檢查。

圖1 內(nèi)業(yè)質(zhì)量檢查流程圖
2)檢查L(zhǎng)CA屬性信息的完整性和正確性,主要包括CC項(xiàng)與TAG項(xiàng)的屬性值錯(cuò)漏檢查、屬性值長(zhǎng)度檢查。
3)檢查L(zhǎng)CA層的拓?fù)鋯栴},主要包括面重疊檢查、面裂隙檢查、面空洞檢查、碎面檢查、面連續(xù)檢查、要素復(fù)合檢查。
4)檢查地表覆蓋分類數(shù)據(jù)采集的平面精度,即采集的地物分界線與影像的套合精度,逐個(gè)圖斑進(jìn)行檢查,重點(diǎn)檢查建筑物、道路、水系等界線明顯的圖斑。
5)檢查L(zhǎng)CA分類精度,主要包括地物類型誤判、未分到最細(xì)類、達(dá)到采集指標(biāo)漏采集、未按“自然優(yōu)先”和“就近就大”原則進(jìn)行分類。
6)檢查接邊情況,確定LCA是否存在空間位置不接邊、屬性信息不接邊錯(cuò)誤。
1)檢查地理國(guó)情要素?cái)?shù)據(jù)層結(jié)構(gòu)及各層要素完整性,主要包括要素多余檢查、要素遺漏檢查、空?qǐng)D層檢查、多余圖層檢查。
2)檢查地理國(guó)情要素各層屬性表信息的數(shù)據(jù)結(jié)構(gòu),主要包括屬性值錯(cuò)漏檢查、屬性值長(zhǎng)度檢查、行政區(qū)代碼完整性檢查、行政區(qū)代碼名稱一致性檢查、國(guó)民經(jīng)濟(jì)代碼正確性檢查、屬性附錄一致性(如GB碼和CC碼不一致)檢查、屬性項(xiàng)限制檢查。
3)檢查地理國(guó)情要素各層的拓?fù)鋯栴},主要包括單獨(dú)層內(nèi)的拓?fù)錂z查、層與層之間的拓?fù)錂z查。
4)檢查地理國(guó)情要素各層數(shù)據(jù)采集的平面精度,逐個(gè)圖斑檢查地理國(guó)情要素是否與影像套合。
5)檢查地理國(guó)情要素?cái)?shù)據(jù)的分類精度,主要包括要素分類錯(cuò)誤、未分到最細(xì)類、達(dá)到采集指標(biāo)漏采集。
6)檢查接邊情況,確定地理國(guó)情要素?cái)?shù)據(jù)層是否存在空間位置不接邊、屬性信息不接邊的錯(cuò)誤。
7)檢查地理國(guó)情要素?cái)?shù)據(jù)和其他數(shù)據(jù)一致性,主要包括與LCA的一致性檢查、與基礎(chǔ)地理信息數(shù)據(jù)和主題數(shù)據(jù)的一致性檢查。
根據(jù)質(zhì)檢問題的性質(zhì)和檢查方法的特點(diǎn),明確具體質(zhì)量問題的最優(yōu)檢查方法,形成綜合3種方法的優(yōu)化質(zhì)檢方案。此方案多采用程序自動(dòng)檢查和人機(jī)交互檢查,減少人工參與,提高了檢查效率,保障了內(nèi)業(yè)數(shù)據(jù)的高精度、高質(zhì)量[8]。質(zhì)檢方案配置見表1。

表1 質(zhì)檢方案優(yōu)化配置
使用質(zhì)量檢查方案,對(duì)四川省廣漢市和湖北省仙桃市地理國(guó)情普查項(xiàng)目中的內(nèi)業(yè)數(shù)據(jù)進(jìn)行質(zhì)量檢查,取得了很好的效果,保證了內(nèi)業(yè)更新的地表覆蓋分類數(shù)據(jù)和地理國(guó)情要素?cái)?shù)據(jù)的完整、真實(shí)、可靠。
1)程序自動(dòng)檢查。通過程序自動(dòng)檢查,標(biāo)記錯(cuò)誤圖斑的空間位置,并將錯(cuò)誤圖斑的信息記錄在檢查屬性表中。圖2中,通過程序自動(dòng)檢查L(zhǎng)CA屬性信息,檢查出圖斑(CC碼為1032)的CC項(xiàng)異常。

圖2 程序自動(dòng)檢查L(zhǎng)CA屬性信息
2)人工對(duì)照檢查。人工對(duì)照檢查時(shí),逐個(gè)圖斑或逐條記錄進(jìn)行檢查,將發(fā)現(xiàn)的錯(cuò)誤標(biāo)記出來,并將錯(cuò)誤對(duì)象(屬性記錄)的ID、錯(cuò)誤類型等信息記錄在檢查記錄登記表中。圖3中,人工對(duì)照檢查L(zhǎng)CA的平面精度,檢查出與影像不套合的圖斑(CC碼為0601)。

圖3 人工對(duì)照檢查L(zhǎng)CA平面精度
3)人機(jī)交互檢查。人機(jī)交互檢查是程序自動(dòng)檢查和人工對(duì)照檢查的結(jié)合,首先通過程序自動(dòng)檢查,確定疑似問題的位置和錯(cuò)誤類型,然后人工檢查確定。圖4中,人機(jī)交互檢查L(zhǎng)CA和地理國(guó)情要素?cái)?shù)據(jù)的一致性,檢查出道路線(ID為1098)穿過LCA中房屋建筑區(qū)的錯(cuò)誤。

圖4 人機(jī)交互檢查數(shù)據(jù)一致性
目前,地理國(guó)情普查質(zhì)量檢查的研究對(duì)質(zhì)檢的內(nèi)容和方法都進(jìn)行了系統(tǒng)的總結(jié),但對(duì)各檢查方法的特點(diǎn)、具體質(zhì)量問題和檢查方法的對(duì)應(yīng)關(guān)系沒有詳細(xì)地進(jìn)行探討。地理國(guó)情普查的質(zhì)檢軟件也有不少,但復(fù)雜環(huán)境下的質(zhì)檢結(jié)果卻不能令人滿意,這些軟件過于追求“大而全”,忽視了有一些質(zhì)量問題并不能通過程序自動(dòng)檢查,或是現(xiàn)階段還不能實(shí)現(xiàn)。本文結(jié)合地理國(guó)情普查內(nèi)業(yè)編輯和質(zhì)量檢查的作業(yè)經(jīng)驗(yàn),配合使用3 種檢查方法,形成了優(yōu)化的內(nèi)業(yè)質(zhì)檢方案,對(duì)內(nèi)業(yè)更新數(shù)據(jù)中的各項(xiàng)質(zhì)量問題給出了最優(yōu)的檢查方法。通過四川省廣漢市和湖北省仙桃市的項(xiàng)目對(duì)質(zhì)檢方案進(jìn)行檢驗(yàn),證實(shí)此方案能夠在復(fù)雜環(huán)境下有效地控制內(nèi)業(yè)數(shù)據(jù)質(zhì)量,可以作為制定地理國(guó)情普查內(nèi)業(yè)質(zhì)檢方案的依據(jù)或參考。
[1]李德仁,睦海剛,單杰.論地理國(guó)情監(jiān)測(cè)的技術(shù)支撐[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2012,37(5):505-512
[2]李建松,洪亮,史曉明,等.對(duì)地理國(guó)情監(jiān)測(cè)若干問題的認(rèn)識(shí)[J].地理空間信息,2013,11(5):1-3
[3]史文中,秦昆,陳江平,等.可靠性地理國(guó)情動(dòng)態(tài)監(jiān)測(cè)的理論與關(guān)鍵技術(shù)探討[J].科學(xué)通報(bào),2012,57(24):2 239-2 248
[4]李建松,周軍其.地理監(jiān)測(cè)原理與應(yīng)用[M].武漢:武漢大學(xué)出版社,2014
[5]國(guó)發(fā)[2013]9號(hào).國(guó)務(wù)院關(guān)于開展第一次全國(guó)地理國(guó)情普查的通知[S].
[6]高天虹,張金剛,劉敏.地理國(guó)情普查成果內(nèi)業(yè)的質(zhì)量控制[J].測(cè)繪與空間地理信息,2014,37(6):210-212
[7]GDPJ09-2013.地理國(guó)情普查檢查驗(yàn)收與質(zhì)量評(píng)定規(guī)定[S].
[8]王小娟,王珊,何鑫星.地理國(guó)情普查過程質(zhì)量控制的思考與總結(jié)——西藏測(cè)區(qū)外業(yè)核查[J].測(cè)繪,2014,37(3):134-137