張彥,于麗君
(1.重慶數字城市科技有限公司,重慶 400020;2.中國科學院遙感與應用研究所,北京 100101)
所謂空間數據質量是指空間數據在表達實體空間位置、特征和時間所能達到的準確性、一致性、完整性和三者統一性的程度以及數據適用于不同應用的能力。正是因為空間數據的質量需要對數據的空間位置、特征和時間三個方面進行評價,在評價的過程中,這三個有一定的關聯性的評價標準既可能定性評價,又可能定量評價,而且針對不同的應用,需要評價的側重點也不同。所以目前的評價方式多是根據經驗人為主觀評價判斷,對評價元素的選定沒有統一的標準,也沒有形成一整套的評價體系。
層次分析法(AHP)原理簡單,是定量與定性方法相結合的優秀決策方法。因此本文嘗試采用層次分析法輔助選取空間數據質量評價元素,力爭通過量化的方法進行空間數據質量評價,改變現有的采用主觀方法進行評價的方式,使評價更加系統性、科學性。
目前,對空間數據的質量評價元素較多,不同的元素分別描述數據的空間位置、特征和時間。根據數據質量研究內容及對空間數據誤差的量化,通過綜合分析,可以基本確定數據質量評價元素主要有以下5個[1~3]:
(1)完整性:描述要素、要素屬性及要素關系存在或不存在。完整性通過多余或遺漏兩個子要素來體現。
(2)邏輯一致性:描述數據結構(包括概念的、邏輯的或物理的數據結構)、要素屬性和它們間的相互關系符合邏輯規則的程度。可以分為概念一致性、拓撲一致性和結構一致性三個子要素。
(3)位置精度:描述要素空間位置的精度,分為平面精度和高程精度。
(4)時間精度:描述要素的時間屬性和時間關系的精度。
(5)專題(屬性)精度:描述要素定量或非定量屬性精度和要素屬性分類正確性及它們間的相互關系。
層次分析法是一種定性和定量相結合的、系統化、層次化的分析方法。所謂層次分析法,是指將一個復雜的多目標決策問題作為一個系統,將目標分解為多個目標或準則,進而分解為多指標(或準則、約束)的若干層次,通過定性指標模糊量化方法算層次單排序(權數)和總排序,以作為目標(多指標)、多方案優化決策的系統方法[4]。
(1)建立層次結構模型[5]
通過深入分析實際問題,將有關的各個因素按照不同屬性自上而下地分解成若干層次,同一層的諸因素從屬于上一層的因素或對上層因素有影響,同時又支配下一層的因素或受到下層因素的作用。根據空間數據的質量評價元素的確定以及不同的質量評價元素之間的關系,可以構建層次結構模型如圖1所示。

圖1 空間數據質量評價元素層次結構模型
(2)構造判讀矩陣
分析各個層次中各因素間的關系,對同一層次各元素關于上一層次中某一準則的重要性進行兩兩比較,構造判讀矩陣。在實際操作中通常根據專家意見,并結合項目質量評價特點,確定各因素的重要性程度,從而構造判讀矩陣P。如兩個評價因素同樣重要,則在判讀矩陣中填入1,稍重要則填入3,極端重要可以填入9。在空間數據質量評價過程中,對于新采集的空間數據,在質量評價過程中,根據實際情況,可以確定其邏輯一致性相對于時間精度就更重要一些,可以使用量化值7,而時間精度和完整性同樣重要,則在判讀矩陣中填入1,見表1。通過同一層次中的不同評價因素之間的兩兩比較,確定重要性因子,則可以構成多個判讀矩陣。

判讀矩陣樣例 表1
(3)特征向量求算
構造判讀矩陣后,需要對每一個判讀矩陣均計算其特征向量。主要步驟有:計算判讀矩陣各列各個元素的和;按照和將判讀矩陣的各行元素的和進行歸一化;對每行歸一化后的向量即為所求權重向量Wi。公式如下:
Wi其中Pij為判讀矩陣P的第i行第j列的數值。分子判讀矩陣第 j行數值之和,分母為判讀矩陣所有元素之和。
(4)進行層次總排序
計算出每一個層級中的判讀矩陣的特征向量后,需要計算各層次對于系統的總排序權重,具體可以先求出每一層相對上一層的權值,然后求出最后一層對第一層的權值,最后求得的權值即為該評價元素的權重。因本文中子層級中的評價元素兩兩相比同樣重要,例如多余和遺漏兩個評價因素在實際檢查中可以視為同樣的評價因素,故子層級的判讀矩陣均取值為1,所以針對本項目實驗中不需要進行層次總排序。
(5)一致性檢驗
在計算出每個判讀矩陣的特征向量后,需要檢驗判讀矩陣的一致性,以保證結果的精確性。一致性的檢驗通過計算矩陣的最大特征根λmax和一致性檢驗值CR實現。
判讀矩陣的最大特征根λmax計算公式如下,其中Wi表示W的第i個分量,n為矩陣階數。

算出λmax后,需要計算一致性檢驗值CR,計算公式如下:

式中RI可查表2得出。

RI參考值 表2
若CR〈0.1,則說明判讀矩陣滿足一致性。否則,需要檢查判讀矩陣中是否有對權重影響比較大的特殊值,并重新咨詢專家意見,對特殊值進行調整后,重新運算。
在對空間數據質量評價的實際操作中,本文針對兩種不同應用的空間數據,采集加工建庫類和更新數據類,分別應用層次分析法,算出每種應用中對空間數據質量進行評價的權重參考值[6]。
采集加工建庫類數據主要針對外業數據采集,一般應用采集工具如GPS、全站儀等,現場實地采集外業數據后,內業進行加工錄入處理。對于此類數據,在質量控制中,對采集的邏輯一致性要求比較高(需要判讀采集的地物之間的邏輯關系,采集結構的規范性等,容易產生采集誤差,故質量要求較高),而采集的時間精度和位置精度一般很準確,故質量要求較低。采集數量的完整性以及屬性的正確性質量要求適中。
根據以上要求,構造判讀矩陣如表3所示。

采集加工建庫類判讀矩陣 表3
數據歸一化處理后,得出權重向量Wi,如表4所示。

采集加工建庫類權重 表4
計算λmax,進行一致性檢驗得出CI/RI=0.089 633〈0.1(表5),通過檢驗,權重值Wi可以采用。

采集加工建庫類檢驗值 表5
更新類數據一般是根據新的不同來源的數據,對現有的數據進行更新處理。這類數據對時間精度要求較高,而數據的完整性、邏輯一致性等質量要求適中,同時更新類數據的位置精度和屬性精度來源確定,一般較少出現錯誤,故質量要求較低。根據實際情況,可以構建更新類數據的質量評價元素的判讀矩陣如表6所示。

更新數據類判讀矩陣 表6
數據歸一化處理后,得出權重向量Wi,如表7所示。

更新數據類權重 表7
計算 λmax,進行一致性檢驗得出 CI/RI=0.054 389〈0.1(表8),通過檢驗,權重值 Wi可以采用。

更新數據類檢驗值 表8
根據以上的分析,運用層次分析法,確定了在實際評價采集加工建庫類和更新類空間數據質量過程中,不同評價因素的權重值,從而可以定量地對一組采集數據的質量情況進行評價。同時在評價過程中,也可以對需要評價的多組數據的錯誤情況進行比較,使評級結果更具有說服力。
如實際在一組采集加工建庫類數據的質量評價中,通過計算機輔助人工瀏覽檢查發現完整性錯誤3個,邏輯一致性錯誤7個,位置精度錯誤2個,時間精度錯誤0個,屬性精度錯誤1個,錯誤總數13個,則可以計算出此組數據的錯誤總數為各種錯誤的加權平均,即:
3*0.1715+7*0.4137+2*0.1224+0*0.0821+1*0.2102=3.8654
而另一組采集加工建庫類數據的質檢過程中發現完整性錯誤5個,邏輯一致性錯誤3個,位置精度錯誤5個,時間精度錯誤2個,屬性精度錯誤3個,錯誤總數18個,而通過層次分析法確定的權重值,可以計算出此組數據的錯誤總數為3.505 4。表面上看第二組數據的錯誤個數更多,但是因為在對采集加工建庫類數據的質量評價過程中,邏輯一致性的正確與否更加重要,因此,可以根據最后的加權錯誤總數大小,認為第二組數據的質量情況較第一組數據稍好。
本文針對不同用途、不同質量評價側重點的空間數據,采用層次分析法,輔助給出了評價元素的權重參考值。并通過實驗,對數據采集加工類和更新類的空間數據進行質量評價,確定了這兩類空間數據的質量評價元素的權重。但是在本文中,判讀矩陣的構造來源還比較單一,還有待收集更多的專家對評價元素的權重意見值,以便使評價結果更加可靠。另外,本文中的子層次的權重都取為1,如果針對比較復雜的情況,可以把子層次的權重一并考慮進入。
[1]GB/T 21337-2008.地理信息質量原則[S].
[2]GB/T 21336-2008.地理信息質量評價過程[S].
[3]胡圣武.GIS質量評價與可靠性分析[M].北京:測繪出版社,2006.
[4]常建娥,蔣太立.層次分析法確定權重的研究[J].武漢理工大學學報·信息與管理工程版,2007(1):153~156.
[5]徐曉敏.層次分析法的運用[J].統計與決策,2008(1):156~158.
[6]劉大杰,劉春.空間數據不確定性與質量控制的研究現狀[J]. 測繪工程,2001,10(1):6~10.