楊 曉 霞,周 艷,楊 容 浩
(1.成都理工大學地球科學學院,四川 成都 610059;2.四川省應急測繪與防災減災工程技術研究中心,四川 成都 610041;3.國土資源部地學空間信息技術重點實驗室,四川 成都 610059;4.電子科技大學資源與環境學院,四川 成都 611731)
基于物元分析的遙感影像查詢多屬性決策模型
楊 曉 霞1,2,3,周 艷4,楊 容 浩1,2,3
(1.成都理工大學地球科學學院,四川 成都 610059;2.四川省應急測繪與防災減災工程技術研究中心,四川 成都 610041;3.國土資源部地學空間信息技術重點實驗室,四川 成都 610059;4.電子科技大學資源與環境學院,四川 成都 611731)
通過構建物元模型將遙感影像的查詢問題轉化為多屬性決策問題。設計了基于拓撲和度量關系相結合的關聯函數,定量評價遙感影像各屬性與用戶需求的關聯度;利用熵權法確定權重反映用戶興趣在遙感影像元數據項上的側重,從而得到個性化的評價結果。實例評價結果證明了該方法的合理性與可行性。
遙感影像查詢;多屬性決策;物元模型
隨著遙感技術的發展,遙感數據呈現出明顯的大數據特征,遙感影像日益多元化,影像數據量呈指數級增長;數據獲取的速度加快,更新周期縮短,時效性越來越強[1]。然而,遙感資源和用戶迅速增加的同時,也出現了“信息過載”問題[2],用戶很難準確獲得所需的信息,信息利用率反而下降。現有的遙感數據共享平臺大多提供若干查詢條件,然后返回查詢結果由用戶瀏覽下載,但用戶對查詢結果的滿意度普遍較低。原因在于:1)遙感影像具有多源、多維、多尺度、多時態特征,需要在多個屬性上對用戶需求的滿足程度進行綜合評價;2)缺少個性化機制,對于不同用戶提供的相同查詢條件,系統都返回相同的結果。解決上述問題的途徑在于進一步提升查詢結果的準確率和個性化,需要解決以下難題:1)多屬性的遙感影像對用戶需求滿足程度的定量綜合評價;2)反映用戶差異的個性化信息的獲取與應用。
遙感影像不同于普通的文本數據或網頁信息,不僅具有空間特征、空間關系特征、非結構化特征等,還表現為多尺度、多時態特征,因此,現有的面向文檔和網頁的個性化搜索方法[3,4]并不能很好應用于遙感影像。遙感影像元數據用于描述數據集的內容、質量、表示方式、空間參考、管理方式及其他特征信息。目前遙感數據共享平臺對遙感影像的查詢往往通過對元數據的查詢來完成,查詢條件主要包括:空間范圍、時間范圍、頻譜范圍、空間分辨率范圍、傳感器類型等。在OGIS、SQL3等空間查詢的標準中,針對空間問題的查詢操作可以歸納為幾何操作、拓撲操作、空間分析操作3類[5],通過從距離關系、方向關系、拓撲關系及空間關系相似性等方面進行分析,可以針對用戶需求得到相關區域的空間數據[6-9]。遙感影像的查詢結果由空間范圍、時間、頻譜、分辨率等多個屬性共同決定,因此,遙感影像查詢可以轉化為多屬性決策問題,解決方法有傳統的TOPSIS方法[10]、改進的TOPSIS方法[11]、集對分析法[12]等,目前已在城市交通、水環境質量評價等方面得到廣泛應用。
本文通過構建物元模型將遙感影像的查詢問題轉化為多屬性決策問題。將查詢條件中涉及的核心元數據以區間數的形式表達:空間范圍以面的形式表達,頻譜范圍以線的形式表達,成像時間、分辨率等以點的形式表達。采用物元分析方法建立遙感影像物元模型,設計了基于拓撲和度量相結合的關聯函數定量計算遙感影像與用戶需求的關聯度。根據用戶查詢歷史數據,采用熵權法確定各核心元數據的權重,反映用戶興趣在遙感影像各元數據項上的側重。最后,利用上述關聯度和權重計算效用度,實現對查詢結果的個性化定量評價,從而使不同用戶查詢后得到最符合自己需求的排序結果。
多屬性決策是利用一定的函數關系對有限個備選方案在有限個決策屬性下的信息值進行綜合集成,進而對方案進行排序和擇優的過程[13]。若將用戶需求作為理想方案,將遙感影像查詢初選結果數據集A={a1,a2,…,am}作為備選方案集,將元數據項X={x1,x2,…,xn}作為決策屬性集,則矩陣Y=(yij)m×n表示m個備選方案對n個決策屬性的決策矩陣。從決策理論的角度看,效用度是指備選方案與理想方案的相對貼近程度,通常效用度越大說明該方案越接近理想方案,越能滿足用戶需求[13]。本文依據效用度的大小對所有備選方案進行排序擇優,以確定最終的查詢結果列表次序。效用度計算公式如下:
(1)
式中:zij為第i個備選方案ai與理想方案在第j個元數據項xj上的關聯度,wj為 xj的權重,ai的效用度ui即為各個元數據項關聯度的加權和。
可見,解決問題的關鍵在于對備選方案在各個元數據項上關聯度的定量評價與權重的確定。
物元分析法是一種多元數據量化決策的新方法,適合于多因子、多屬性的評價問題[14]。遙感影像多屬性決策物元模型的建模思路為:首先根據用戶提出的查詢條件建立理想物元,然后將查詢初選結果作為備選方案并構建多維物元,設計關聯函數計算出備選物元與理想物元的關聯度,最后通過計算效用度對各方案進行排序并確定最優結果。
2.1 遙感影像物元模型
物元指描述事物的基本元,它可以用三元組R=(N,c,v)表示,其中N表示事物,c表示特征的名稱,v表示N關于c所取的量值,這三者稱為物元的三要素。若一個事物由多個特征元組成,則用n維物元描述[14],物元模型的一般形式如下。
(2)

(3)
式中:yi代表ai的物元模型,xj為決策屬性的第j個元數據項,yij為ai在xj上的區間范圍。
2.2 理想物元
理想物元R*是各屬性值均達到最優值構成的物元,一般形式如下:
(4)

2.3 設計關聯函數計算關聯度
由于遙感影像各個元數據的含義不同,不同元數據項屬性值的計算方法也不同,使得物元模型各個特征的量綱各異。為使評價結果具有公度性,本文通過構造關聯函數將各屬性進行標準化處理。
常用的關聯度評價標準有距離和夾角余弦,但是這兩類標準更適合于衡量單點之間的關聯度。然而衡量遙感影像是否滿足用戶需求的標準在于是否包含或者重疊了用戶查詢范圍,而不是距離上的接近。本文設計了關聯函數,基于拓撲與度量關系分析對備選物元與理想物元的關聯度進行定量評價。

(5)
式中:zi1代表yi1與r1的關聯度,yi1∩r1為yi1與r1的重疊區間。


表1 r2與yi2在二維區間上的拓撲關系Table 1 The topological relationship between r2and yi2
根據拓撲關系,設計二維區間的關聯函數如下:
(6)
式中:zi2代表yi2與r2的關聯度,area()為求面積的函數。
考慮到地球是一個近似的旋轉橢球體,因此由兩條子午線(經線)和兩條平行圈(緯線)圍成的橢球表面是一個橢球面梯形,其面積的計算公式如下[16]:
(7)
式中: L1和L2為經度范圍,B1和B2為緯度范圍;b和e2為橢球元素值,因我國1980年國家大地坐標系采用1975年國際橢球,其參考橢球在我國境內與大地水準面最為密合,故采納1975年橢球元素值,b=6 356 755.2881575287m和e2=0.006694384999588。

(8)
用戶興趣隱藏于檢索歷史中,檢索頻率越高的元數據項對于用戶興趣的貢獻就越大,反之則越小。本文用權重wj描述不同元數據項xj對用戶興趣的貢獻,反映不同元數據項之間的相對重要性。權重對搜索結果排序有著重要影響,熵權法確定的權重較客觀且符合實際[17]。按照信息論基本原理,熵代表該屬性在該問題中提供有效信息量的多少,如果屬性的信息熵越小,則該屬性所提供的信息量越大,在綜合評價中所起作用理當越大,相應權重則越高。本文將用戶對不同元數據項的檢索次數作為信息熵指標,直接根據指標的原始信息通過統計的方法獲得權重,盡量消除各指標權重的主觀性。
根據檢索歷史,將用戶在過去一段時間內的檢索記錄分為k組,分別統計每一組內對n個元數據項的檢索次數,并且用一個矩陣B=(bij)k×n記錄,其中bij表示第i組檢索記錄中用戶對元數據項xj的檢索次數。
利用熵權法確定權重,需經過以下3個步驟:
(1)原始數據標準化處理:
(9)
式中:sij為用戶第i組檢索記錄中對元數據項xj檢索次數的標準化值,bij表示第i組檢索記錄中對元數據項xj的檢索次數;min(bpj) 和max(bpj)(p=1,2,…,k)分別為k組檢索記錄中元數據項xj被檢索次數的最小值和最大值。
(2)計算各元數據項的信息熵。按照信息論基本原理,信息熵的定義如下:
(10)
(11)
(3)計算元數據項權重。令元數據項xj的權重為wj,則:
(12)
本文將文獻[18,19]中方案 1-6 的實驗數據作為備選方案集,并模擬生成了近一段時間用戶對遙感影像的檢索記錄,對本文提出的模型和方法進行驗證。
步驟1:將用戶的查詢條件作為理想物元:
步驟2:建立備選方案1-6的物元模型:
步驟3:根據關聯函數式(5-8)得到備選方案的關聯度物元模型:
步驟4:采用熵權法計算權重,模擬生成近一段時間用戶對遙感影像的7組檢索記錄,由式(10-12)得各元數據項的權重向量為:
W=(0.1120,0.4799,0.1737, 0.2344)T
步驟5:由式(1)得6種備選方案的效用度為:
u1= 0.533,u2= 0.298 ,u3= 0.298,
u4=0.414,u5= 0.408,u6=0.209
效用度越高則與用戶需求的關聯程度越高,所以返回給用戶的查詢結果列表a1> a4> a5> a2> a3> a6,方案1為最佳方案。通過與文獻[18]對比分析可知,該評價結果可信,評價方法可行。
本文在考慮遙感影像特點的基礎上,設計了基于拓撲和度量關系的關聯函數,定量計算各核心元數據與用戶需求的關聯程度,采用多屬性決策方法提高了遙感影像查詢的查準率和個性化水平。本文只針對4項核心元數據進行了分析,今后繼續對其他元數據(如傳感器、軌道號、產品級別、數據質量等)進行研究。此外,關聯函數還有待于進一步優化,以空間分辨率為例,由于低分辨率的影像可由高分辨率影像重采樣而來,因此分辨率高于查詢條件的遙感影像的關聯度應大于分辨率低于查詢條件的遙感影像的關聯度。這就要求在設計關聯函數時除了考慮區間覆蓋的拓撲關系外,還應該與實際應用相關聯,才能不斷提升遙感影像共享的應用水平。
[1] 李德仁,張良培,夏桂松.遙感大數據自動分析與數據挖掘[J].測繪學報,2014, 43(12):1211-1216.
[2] 陳潔敏,湯庸,李建國,等.個性化推薦算法研究[J].華南師范大學學報(自然科學版),2014,46(5):8-15.
[3]BRINS,PAGEL.TheanatomyofalargescalehypertexualWebsearchengine[A].Proceedingofthe7thWorldWideWebConferenceBrisbane[C].1998.
[4] 劉金紅,陸余良.主題網絡爬蟲研究綜述[J].計算機應用研究,2007,24(10):26-29,47.
[5] 艾廷華,帥赟,李精忠.基于形狀相似性識別的空間查詢[J].測繪學報,2009,38(4):356-362.
[6] 杜世宏,秦其明,王橋.空間關系及其應用[J].地學前緣,2006,13(3):69-80.
[7] 劉瑜,龔詠喜,高勇,等.地理空間中的空間關系表達和推理[J].地理與地理信息科學,2007,23(5):1-6.
[8] 鄧敏,李成名,劉文寶.利用拓撲和度量相結合的方法描述面目標間的空間關系[J].測繪學報,2002,31(2):164-169.
[9] 李學淵,陳時磊,邊凱.礦山開發要素空間拓撲關系的判定與應用[J].測繪通報,2015(3):49-52.
[10] JEE D H,KANG K J.A method for optimal material selection aided with decision making theory[J].Materials and Design,2000,21(3):199-206.
[11] 夏宇,朱欣焰.利用區間分析的空間信息智能分發決策[J].武漢大學學報(信息科學版),2013,38(9):1103-1107.
[12] 葉躍祥,糜仲春,王宏宇,等.一種基于集對分析的區間數多屬性決策方法[J].系統工程與電子技術,2006,28(9):1344-1347.
[13] YOON K.System selection by multiple attribute decision making[D].Manhattan,Kansas:Kansas State University,1980.
[14] 楊春燕,蔡文.可拓學[M].北京:科學出版社,2014.
[15] 胡啟洲,張衛華.區間數理論的研究及其應用[M].北京:科學出版社,2010.
[16] 孔祥元,郭際明,劉宗泉.大地測量學基礎(第二版)[M].武漢:武漢大學出版社,2010.
[17] 周榮喜,劉善存,邱菀華.熵在決策分析中的應用綜述[J].控制與決策,2008,23(4):361-366.
[18] 李新廣,范明虎,杜武.面向空間信息智能分發的動態化用戶偏好模型研究[J].測繪學報,2011,40(5):646-654.
[19] 夏宇.面向空間信息智能分發的用戶偏好模型研究[D].武漢:武漢大學,2009.
Multi-attribute Decision Making Model of Remotely Sensed Image Query Based on Matter-Element Analysis
YANG Xiao-xia1,2,3,ZHOU Yan4,YANG Rong-hao1,2,3
(1.EarthSciencesSchool,ChengduUniversityofTechnology,Chengdu610059;2.SichuanEngineeringResearchCenterforEmergencyMapping&DisasterReduction,Chengdu610041;3.KeyLaboratoryofGeoscienceSpatialInformationTechnology,MinistryofLandandResourcesoftheP.R.China,ChengduUniversityofTechnology,Chengdu610059; 4.SchoolofResourcesandEnvironment,UniversityofElectricScienceandTechnologyofChina,Chengdu611731,China)
The growth in the remotely sensed image available has led to information overload,as navigating through and finding relevant information has become more and more challenging.In this paper,a multiple attribute decision model is proposed to assist the user in his/her quest for accurate data.By constructing a matter-element model,the solutions of the remotely sensed image query can be converted into the solutions of multiple attribute decision of an alternative scheme.In addition,correlation functions combining topology with metrization are proposed to evaluate the similarity degree between user′s requirement and data quantitatively.The entropy-weight method is used to calculate the weight from user early search record,which reflects user preference on different metadata of remotely sensed image.Therefore,the advantages and disadvantages of different schemes can be compared.Finally,an example is given to show the usability of the presented model.
remote sensing information query;multi-attribute decision making;matter-element model
2015-10-21;
2016-01-09
國家自然科學基金項目(41201440;41471332;41101354);教育部博士點基金項目(20125122120014);四川省應急測繪與防災減災工程技術研究中心開放基金資助項目(K2015B002,K2014B001);四川省教育廳理科重點項目(15ZA0078)
楊曉霞(1977-),女,博士,講師,研究方向為地理信息服務。E-mail:yangxx2003@126.com
10.3969/j.issn.1672-0504.2016.02.006
P208
A
1672-0504(2016)02-0027-05