李新廣,范明虎,杜 武
武漢大學測繪遙感信息工程國家重點實驗室,湖北武漢430079
空間信息智能分發是主動空間信息服務技術的重要組成部分[1],近年來得到了廣泛關注。20世紀90年代以來,以美國為代表的西方國家就開始研發空間信息智能分發系統。1996年,美國開始研發戰場警覺及數據分發系統[2-3],1999年開始實施全球信息柵格項目[4]。2001年美國提出“智能節點”的概念,并于2003年結合“網絡中心戰”的思想開始在軍事決策系統中投入使用[5-7]。2004年,美國啟動戰術級作戰人員信息網項目[8]。在國內,近幾年也出現了一些相關研究,但主要集中在分發系統架構層面,且多是對國外相關研究的一些介紹[9-11]。總體而言,由于空間信息的獨特性及復雜性,用戶偏好模型的構建及其效用度評估算法一直是制約空間信息智能分發研究取得進展的關鍵瓶頸。
夏宇針對遙感數據的分發,探索性地采用區間數表達具有區間范圍特征的經度、緯度、時間、頻譜和空間分辨率等指標的用戶檢索特征[12],并通過對TOPSIS方法加以擴展進而構建用戶偏好模型[13],較好地解決空間數據各屬性特征的表達問題,不過該方法仍存在空間范圍定位不夠準確、效用度估計存在偏差、特征值分布過于集中、模型缺少完整的動態化機制等不足[9-11]。為此,本文作出以下擴展:①為便于存儲和計算,將不規則子區間進一步分割為基本區間單元,用于記錄頻譜、空間分辨率和時間偏好特征;②引入區域數以準確表達空間范圍,將最小區域范圍分割為基本區域單元,用于記錄空間范圍偏好特征;③將三元組模型擴展為四元組模型,用以完整記錄用戶偏好;④引入興趣度密度、興趣度的概念和相應算法,以便均衡、合理地反映目標區間(區域)范圍內用戶各次檢索的貢獻;⑤增加用戶信息反饋、基于權值衰減函數的權值衰減因子等動態化機制,使模型完全動態化。試驗表明,本文的模型能夠隨著用戶興趣的轉移更為及時、準確地自行調整。
目前,一些非空間信息智能分發系統已經考慮到模型的動態化因素,其原理是通過引入權值衰減函數,使不同時段的訪問信息在表達用戶偏好的過程中被賦予不同的權重[14-15]。斯坦福大學的FAB自適應文檔推薦系統是非空間信息智能分發系統的典型代表,它通過引入一個簡單的權值衰減函數 h(t)=0.97t對不同時段用戶的信息獲取進行加權,即系統每天晚上均將用戶全部特征乘以一個衰減系數0.97,從而實現“古老”信息與“最新”信息相比權重較低[16]。
模型的動態化因素沒有得到充分考慮是當前空間信息智能分發研究共有的局限。現有的智能分發系統主要通過不斷更新用戶檢索記錄,以建立和修正用戶偏好模型的方式使模型動態化。由于用戶檢索記錄的時間跨度往往較大,同時用戶的偏好特征也會隨著時間和需要的變化出現一定波動,因而,即便對于同一用戶,他在不同時段的檢索記錄對于其偏好特征的表達也會有不同貢獻,應賦予不同權值。另外,模型缺少完善的用戶信息反饋機制也是現有模型動態化的薄弱環節。僅根據用戶的檢索記錄生成的偏好模型雖然能在一定程度上反映用戶的偏好特征,但這種偏好模型卻難以及時反映用戶偏好特征的變化。引入用戶信息反饋機制能夠彌補這一缺陷。由于用戶在獲得分發結果之后,會根據自己的判斷選擇一些較理想的結果,打開或者下載其中的數據,而這一行為反映了用戶的興趣偏好[17]。
綜上所述,空間信息智能分發的動態化模型主要包括三個方面的動態化分量:①通過隱式或顯式地獲取用戶檢索記錄,不斷地對用戶模型進行修正,這是現有模型都已實現的模型動態化分量;②是通過引入權值衰減函數,對不同時段的用戶行為進行加權求和的模型動態化分量;③通過用戶信息反饋引入的模型動態化分量。第一種分量已蘊含在用戶的每一次檢索記錄中,本文重點討論后兩種情況。為便于討論,①中所建模型稱為靜態模型,考慮②、③因素的模型稱為動態模型。
用戶模型采用四元組形式

式中,X={x1,…,xi,…,xs};W={w1,…,wi,…,ws};R={R1,…,Ri,…,Rs};V={V1,…,Vi,…,Vs}。xi依次為空間范圍、頻譜范圍、時間范圍、空間分辨率范圍等元素項,s為元素項個數(注:僅考慮具有連續變化范圍的元素項,傳統類型的解決方案見文獻[9—11]),wi為xi的權值。Ri為xi的分布范圍和步長,分兩種情況:對空間范圍,Ri=[XminXmaxXstepYminYmaxYstep],i= 1,其中,Xmin、Xmax、Xstep、Ymin、Ymax、Ystep分別為檢索區域經緯度分量的分布范圍的最小值、最大值、步長;②對頻譜范圍、時間范圍、空間分辨率范圍等區間類型,Ri=[XminXmaxXstep],i=2,3,4,其中,Xmin、Xmax、Xstep分別為分布范圍的最小值、最大值、步長。Vi為反映xi分布特征的數值矩陣或向量,分三種情況:①對于空間范圍,Vi={ρg,k| g=1,2,…,m,k=1,2,…,t},i=1,是數值矩陣, ρg,k為空間范圍內對應基本區域單元上的分布密度值,m、t分別為經、緯度方向基本區域單元的個數;②對于頻譜范圍i=2是數值向量,ρg為頻譜范圍內對應基本區間單元上的分布密度值,m為頻譜范圍內的基本區間單元個數;③對于時間和空間分辨率,Vi=是數值向量,νi,g為時間、空間分辨率分布范圍內對應基本區間單元上出現的頻率值,mi為相應元素項分布范圍內基本區間單元的個數。
用戶對空間信息的獲取通常在一段時期內反復進行,其信息的獲取記錄是時間的函數。假定用戶的偏好特征在一定時間內相對穩定,且隨著時間的推移小幅波動,則有理由認為,對于一組不同時間內獲取的數據,獲取的時間距現在愈近,愈能反映用戶當前的需要,反之,亦然。也就是說,用戶檢索記錄的權值是時間的函數,時間距現在愈久,權值愈小,反之,則愈大。若將以后的檢索記錄也包括在內,則權值衰減函數的曲線類似于圖1。圖中,權值曲線 h(t)是一支在當前時間(t=tn)取最大值,在tn兩側逐漸遞減的單峰值曲線,h(t)=0及 h(t)=h(tn)是其漸近線。假設以后(t>tn)的檢索記錄存在,則可以認為,包括過去和將來的所有檢索記錄的全體整體上反映了用戶目前的偏好特征。事實上,只能得到以前(t≤tn)的記錄,因而,權值曲線應該取 t≤tn時的左半支,即認為到目前為止的所有檢索記錄的全體整體上反映用戶的偏好特征(圖2)。

圖1 權值衰減函數曲線特征Fig.1 Characteristic of weight attenuation function curve

圖2 權值衰減函數曲線Fig.2 Weight attenuation function curve
正態分布的密度函數較好地符合了圖1所示的權值曲線的特征。據此,本文對其概念加以拓展,用以定量描述用戶檢索記錄的權值。如下式

式中,tn代表當前時間;σ為衡量用戶檢索記錄貢獻的時間均方差。假設對于某一用戶,時間段Δt以前的檢索記錄對現在的偏好建模沒有貢獻,根據h(t)函數的特點,可以取σ=Δt/3,這是因為[tn-3σ,tn]區間內的權值積累達到了總權值的99.74%,此時可以忽略 t 權值向量的確定采用文獻[9—11]的方法,但考慮模型動態化的影響,步驟如下: (1)各元素項檢索和反饋的頻率統計 式中,di表示第i個元素項各檢索和反饋記錄的權值之和;dt表示全部檢索和反饋記錄的權值之和;s為元素項的個數;pi表示第i個元素項基于權值衰減函數的檢索和反饋頻率。 (2)檢索和反饋頻率歸一化 式中,p′i表示第i個元素項的基于權值衰減函數的歸一化的檢索和反饋頻率。 (3)權值為歸一化的檢索和反饋頻率 由于空間范圍包含經、緯度兩個數據項的信息,故步驟(2)中計算空間范圍的歸一化的檢索和反饋頻率時,pi應取經、緯度頻率之和,使計算出的空間范圍的權值為經緯度權值之和。 3.4.1 區域數 對區間數的概念加以拓展,引入區域數用以表達空間范圍這一二維區間,它表示一片沿 X、Y軸均有一定連續范圍的矩形區域。形式如下: [[a,b],[c,d]]表示分別沿 X、Y軸方向的區間[a,b]和[c,d]圍成的矩形區域;[[a,b),[c,d)]表示分別沿 X、Y軸方向的區間[a,b)和[c,d)圍成的矩形區域;[(a,b),(c,d)]表示分別沿 X、Y軸方向的區間(a,b)和(c,d)圍成的矩形區域。其他情況依此類推。 3.4.2 基本區域單元 式中,m、t分別為D沿X、Y方向分割的區域單元的個數。則以下條件恒成立:① Xmin+m× Xstep=Xmax,Ymin+t×Ystep=Ymax;②對于任一樣本值 Zk的經度的上下限ξg、緯度的上下限ηk,均存在唯一的 i、j,滿足 Xmin+i×Xstep=ξg,Ymin+ j×Ystep=ηk。則當 Xstep、Ystep均取最大值時,稱Ui,j為空間范圍D上的基本區域單元。 3.4.3 基本區間單元 式中,m為I分割為區間單元的個數。則以下條件恒成立:①Xmin+m×Xstep=Xmax;②對于任一樣本值 Zk的上下限ξg,均存在唯一的i,滿足 Xmin+i×Xstep=ξg。則當 Xstep取最大值時,稱 Ii為區間范圍I上的基本區間單元。 頻譜范圍元素項用區間數表達,采用文獻[9, 18—19]的符號數據分析法,用戶的每一個檢索樣本都代表了用戶在tk時刻的一次檢索意圖,相對于當前時刻tn而言,可以認為這些樣本的權值為 h(tk)。樣本區間長度愈短,用戶的檢索目標愈集中,單位區間長度上凝聚用戶愈多的檢索意圖;反之,亦然。因此,若令代表所有頻譜范圍樣本的權值之和,則元素項的分布特征可由經驗密度函數式(10)表達。其中,對應每一個ξi的函數值都代表區間[ξi,ξi+Δ ξ],Δ ξ→+0上用戶對相應信息的關注程度 式中,Ik(·)是示性函數,表示ξ是否存在于 Zk中,ξ為頻譜值;‖·‖表示區間寬度。式(11)表達用戶對區間 Ix上信息的關注程度 據此,引入興趣度、興趣度密度的概念,用于所述關注程度的數學表達,定義如下。 興趣度:根據興趣度密度式(10)的定義,由式(11)定義的函數即為興趣度函數,在某一給定區間 Ix上,由該函數求得的函數值即表達了用戶對相應區間信息的偏好程度,定義為興趣度。 4.2.1 分布特征 空間范圍元素項用區域數表示,用戶的每一個空間范圍檢索樣本都代表了用戶的一次檢索意圖,相對于當前時刻tn而言,可以認為這些樣本值的權值為 h(tk)。樣本區域面積愈小時,用戶的檢索目標愈集中,單位區域面積上凝聚用戶愈多的檢索意圖;反之,亦然。因此,若令 h=代表所有空間范圍樣本觀測值的權值之和,則元素項的分布特征可由經驗密度函數式(12)表達。其中,對應每一個(ξi,ηj)的函數值ρz(ξi,ηj),都代表區域[[ξi,ξi+Δ ξ],[ηi,ηi+Δ η]], Δ ξ→+0,Δ η→+0上用戶對相應信息的關注程度 式中,Ik(·)是示性函數,表示(ξ,η)是否存在于Zk中,(ξ,η)為空間范圍中的某一點;‖·‖表示區域面積。式(13)表達用戶對區域Dx,y上信息的關注程度 則表達相應關注程度的興趣度、興趣度密度定義如下。 興趣度:根據興趣度密度式(12)的定義,由式(13)定義的函數即為興趣度函數,在某一給定區域Dx,y上,由該函數求得的函數值即表達了用戶對相應區域信息的偏好程度,定義為興趣度。 4.2.2 興趣度的分解 由式(13)計算的興趣度包含了經、緯度兩個元數據項的信息,需將其沿經、緯度方向進行分解。興趣度的取值同時受用戶偏好模型和待分發數據空間范圍的影響,情況較為復雜,很難精確量化,但可以基于以下假設求其近似值:①通常在檢索次數足夠多的情況下,偏好模型的空間范圍因素在經、緯度方向的分量分布特征應相對穩定,興趣度基本上反映目標區間上的用戶偏好程度;②若將空間范圍分解為兩個獨立的沿經、緯度方向的區間變量,則借鑒4.1節式(10)、式(11)的方法,可以計算經、緯度區間變量上的興趣度,由于本模型中此處經緯度的興趣度通過對目標區間內的興趣度密度積分求得,它反映用戶偏好的分布特征,故可近似反映空間范圍內經、緯度方向興趣度分量的相對關系;③空間范圍的興趣度沿 X、Y方向的分量之間的比值可近似由之間的比值表達。據此,空間范圍的興趣度在經、緯度方向的分量近似為 和頻譜范圍一樣,在根據時間和空間分辨率進行數據檢索的過程中,用戶也常用區間數來表達需求范圍,但元數據表達上有所不同:①時間元數據雖然也表現為一個區間范圍,但由于遙感成像幾乎是瞬時完成的,故在進行效用度計算時,時間更適合作為一個點來處理;②空間分辨率則直接表現為一個或幾個離散點。有些遙感數據一景影像中的各個波段空間分辨率是一致的,也有些波段較多的影像中,一景影像存在著幾個不同的分辨率。據此,在建立偏好模型時,可用區間數來表達用戶檢索中時間和空間分辨率的偏好情況,而在進行效用度估計時,則應當作為一個或幾個離散點來處理。 對于時間和空間分辨率,采用文獻[9, 18—19]的符號數據分析法。用戶的每一個檢索樣本值都代表了用戶在tk時刻的一次檢索意圖,相對于當前時刻 tn而言,可以認為這些樣本值的權值為h(tk)。若令代表所有時間范圍或空間分辨率范圍樣本觀測值的權值之和,并采用νg(各基本區間單元的基于權值衰減函數的加權頻率)表達各基本區間單元的分布情況,以此表達用戶的偏好特征,則對于給定遙感數據的元數據項,其成像時間和空間分辨率所對應的用戶偏好模型中相應元素項的值,客觀上反映了用戶對相應數據的關注程度,即興趣度。則興趣度函數為 式中,x為時間或空間分辨率元素項的屬性值,且x在基本區間單元 Ig上。對于一景影像存在數個空間分辨率的情況取分辨率對應的最大頻率值。 采用文獻[9—11]的方法,從決策理論角度出發,將待分發信息集作為方案集,其決策矩陣如表1。 表1 決策矩陣Tab.1 Decision matrix 其中,Sj為備選方案;xi為元素項;γji為Sj相應于 xi的屬性值。對于空間范圍,γji為區域數其中為備選方案的經度下、上限為緯度下、上限。對于頻譜范圍,γji為區間數對于時間或單一空間分辨率,γji為一數值,對多分辨率數據, γji為空間分辨率的集合。 根據式(11)、(14)、(15)和(16),分別計算頻譜范圍、空間范圍、時間和空間分辨率的興趣度。 備選方案Sj的效用度μj為各個元素項的興趣度的加權和,由下式計算 式中,wi為元素項xi的權值;ψi為xi的興趣度。 在獲取效用度之后,便可以根據效用度的大小對信息進行分發。具體操作上分推送模式和拉取模式兩種情況,其思路略有不同[16]。 (1)推送模式。可以根據用戶設定的閾值 Tr進行分發,即當μj≥Tr時,將數據分發給相應的用戶,否則不分發。或者,首先對最近的某一個時期內用戶檢索的數據進行效用度計算,找出其中最小的效用度,以此作為默認閾值,決定是否分發。 (2)拉取模式。首先,根據用戶的檢索條件,獲取滿足要求的方案集。比如,對于區間數或區域數類型的元素項,可以檢索與用戶輸入的區間數或區域數相交的備選方案,而對于點(或點集)類型的元素項,可以檢索出落入檢索區間內的備選方案。然后,計算上一步結果集各方案的效用度,根據效用度大小排序,并以此作為數據推薦的優先次序。 檢索記錄并不能完整地反映用戶的真實需求,同時由于檢索記錄相對較少,這導致所生成的用戶模型較為粗糙和相對滯后,難以準確、及時地反映用戶的偏好特征及其變化。通過收集用戶的信息反饋能夠彌補這一不足。本文通過記錄用戶打開、下載的數據的特征,并據此對原有模型進行修正,從而使模型能夠根據用戶興趣的轉移及時做出調整。鑒于用戶檢索和信息反饋是一種反復迭代的動態過程,對兩者一并考慮,算法如下: (1)在信息分發過程中,記錄用戶每次打開、下載數據的各元素項的值。 (2)將每次的記錄結果反饋給系統,修正原有模型,步驟如下。 對于空間范圍。首先,根據式(12)計算用戶檢索數據的偏好模型。然后,根據式(12)并結合上一步的計算結果,計算用戶反饋數據的空間范圍對用戶偏好模型的貢獻(注:由于用戶反饋數據的空間范圍有可能不是規則的矩形,在此情況下,反饋數據的空間范圍并不參與基本區域單元的分割,而只參與計算偏好模型的興趣度密度值)。反饋數據的空間范圍和此前各次檢索的空間范圍的全體的興趣度密度函數,作為空間范圍元素項修正后的用戶偏好模型。此時,興趣度密度公式為 式中,E′為用戶檢索記錄和反饋數據空間范圍樣本的集合;h′為 E′中各樣本時間權值之和;Z′k, k∈E′為檢索或反饋的空間范圍樣本;h′(tk)為 tk時刻樣本的權值;I′k(·)為示性函數,表示是否在Z′k中,(ξ,η)為空間范圍中的某一點,‖·‖表示區域面積。考慮用戶反饋后的興趣度計算方法類似于式(13),其原理為對給定的空間范圍目標區域內的興趣度密度(見式(18))進行積分求和。興趣度沿 X、Y方向的分量類似于式(14)和式(15),分解原理同4.2節。 對于頻譜范圍。反饋的頻譜范圍采用與原模型用戶檢索的頻譜范圍相同的方式參與基本區間單元的分割和興趣度密度的計算。此時,興趣度密度公式為 式中,E′為用戶檢索記錄和反饋數據頻譜范圍樣本的集合;h′為E′中各樣本的權值之和;Z′k,k∈E′為檢索或反饋的頻譜范圍樣本;h′(tk)為 tk時刻樣本的權值;I′k(·)為示性函數,表示ξ是否在Z′k中,ξ為頻譜值,‖·‖表示區間寬度。考慮用戶反饋后的興趣度計算方法類似于式(11),其原理為對給定的空間范圍目標區間內的興趣度密度(見式(19))進行積分求和。 對于時間。首先,根據式(16)計算用戶檢索數據的偏好模型。然后,根據式(20)計算用戶反饋數據的時間屬性對用戶偏好模型的貢獻(由于用戶反饋數據的時間屬性為點值,故反饋數據的時間值并不參與基本區間單元的分割,而只參與模型修正)。 式中,E′為用戶反饋的時間樣本集合;Ig是基本區間單元;h′為時間元素項的反饋數據和原模型中檢索記錄的權值之和;Tk,k∈E′,為第 k次反饋數據的生成時間;h′(tk)為 tk時刻樣本的權值; I′k(·)為示性函數,表示 Tk是否在 Ig中。式(16)與式(20)之和即為修正后的時間元素項的偏好模型,如下 式中,h′為時間元素項的反饋數據和原模型中檢索記錄的權值之和,其他參數含義同上。取為考慮用戶反饋后的時間元素項的興趣度,它體現了用戶對目標時間點的空間信息的關注程度。 對于空間分辨率。其偏好模型的計算方法類似于時間,區別在于若空間分辨率不唯一時,需要遍歷計算所有分辨率值的貢獻。 (3)根據修正后的模型,計算備選方案的效用度,根據效用度的大小對方案進行優劣排序,并據此進行下一次的信息分發。 (4)重復執行以上步驟。 試驗數據源于文獻[9]:①根據文獻[9]中4.5.2.4節的用戶檢索數據生成用戶模型,為了生成動態模型,對原始數據增添了檢索時間;②選取文獻[9]中5.2.2.3節方案1~8的數據作為備選方案。 根據數據①,分別建立靜態用戶模型和動態用戶模型。兩種模型的元素項的權值見表2。根據兩種模型,分別計算②中備選方案的效用度:根據靜態模型算得的備選方案的效用度見表3;根據動態模型算得的備選方案的效用度見表4;文獻[9]中備選方案的效用度見表5。 表2 用戶偏好模型元素項的權值Tab.2 Element weights of user profile model 表3 基于靜態模型的待分發方案的效用度及各元素項的興趣度Tab.3 Utility degrees of items to be distributed and interest degrees of each element based on static model 表4 基于動態化模型的待分發方案的效用度及各元素項的興趣度Tab.4 Utility degrees of items to be distributed and interest degrees of each element based on dynamic model 表5 文獻[9]中方案的效用度Tab.5 Utility degrees of items in the literature[9] 表2顯示,兩種算法所生成的權值有一定的差異,這是由于權值衰減函數引入前后,模型的動態化因素對權值有著不同程度影響,后者中模型的時效性得到了進一步加強。顯然,相較于前者,動態模型更能反映用戶當前的信息偏好。 表3和表5均基于靜態模型算得。對比兩表可以看出,兩種方法中效用度計算結果相差較大,但總體趨勢相近,原因如下三種:文獻[9]以特征值代替頻率值作為計算效用度的依據,人為地增大了取值較小的各元素項的相似度值;文獻[9]以與頻譜范圍的目標區間相交的各不規則子區間的特征值中的最大值作為相似度,而不考慮同時與其相交的其他子區間的影響,這也在一定程度上增大了效用度的取值;經、緯度范圍在存在第二種誤差的同時,也存在一些不相關的緯、經度樣本值的影響。因為,一些在二維空間上根本不相交的空間范圍,其在經、緯度上的分量卻可能是相交的,這會對效用度的計算產生影響。從表3可以看出,空間范圍的興趣度普遍較小,這是因為這些待分發的數據在二維經緯度空間上與用戶檢索頻繁的空間位置重疊較少。 對比表3、表4可以發現,相較于前者,后者的興趣度和效用度值大多存在不同程度的變化,變化方向也不一致,這是由不同原因造成的。權值衰減函數的引入對發生在不同時段的用戶檢索和反饋信息的建模貢獻進行了不同程度的拉伸或抑制,因此,相對于文獻[9]和本文的靜態模型而言,引入了動態化因素的建模算法,使得模型更能體現用戶近期的行為特征。較于表3、表4中元素項的興趣度存在以下特征:①頻譜范圍興趣度均有一定程度的微幅減小,這主要是因為用于用戶偏好建模的頻譜范圍檢索行為主要集中在較早時段,而在近期較少發生(用戶檢索時該元素項缺省),這導致頻譜范圍元素項的興趣度密度經驗函數取值整體偏低;②空間分辨率的興趣度則同時存在小幅度的增大和減小兩種情況,這是因為,相較于用戶檢索行為的發生時間而言,用于偏好建模的空間分辨率范圍檢索數據的各區間分布較為均勻,在根據權值衰減函數進行加權建模時,雖然部分檢索行為的建模貢獻被抑制,但另外一部分卻得到了拉伸,這使得在各備選方案的分布位置的興趣度經驗密度值波動不大,但同時也存在一定的此消彼長;③時間元素項的興趣度同時存在增大、減小和不變三種情況,其中,方案1、2、3和5興趣度大小不變,這是因為這些方案的值均介于用戶檢索的時間范圍建模數據的分布區間之內,基于權值衰減函數的加權建模對興趣度取值無影響,方案4、6、7和8均位于建模數據分布區間兩端,且僅受部分檢索記錄不同程度、不同方向的影響,故同時存在增大和減小的情況;④空間范圍元素項中的經度和緯度指標的分布存在較多情況,方案7和8在表3和表4中均取值為0,這是因為兩方案的空間范圍取值與用戶所有的檢索建模數據分布范圍均不相交,這種情況在文獻[9—11]的算法中無法得到體現。方案1~6則均同時存在增大和減小的情況,原因類似于②和③中分析的情況,區別在于空間范圍的經度和緯度之間存在著相關性,兩者是以區域數(基本區域單元)的形式作為整體參與運算的;⑤在①~④中各因素的綜合作用下,各方案的效用度均出現不同程度增減。 表3、表4的對比結果表明,各動態化因素對于各元素項的興趣度以及最終的效用度都有比較明顯的影響,該影響基本上能夠更為真實地反映用戶當前的偏好特征。 現有的空間信息智能分發的理論研究和系統實現存在著空間范圍定位不夠準確、效用度計算存在偏差等缺陷,且大多仍停留在非完全動態化的層面,它們往往只關注用戶的檢索行為對偏好建模的貢獻,很少注意到用戶反饋的作用,且均未考慮時間因素的影響,從而導致用戶偏好模型難以準確、及時地反映用戶興趣特征的變化。鑒于此,本文對現有文獻的理論和算法進行擴展,通過引入區域數、興趣度、興趣度密度等概念和算法,并引入權值衰減函數和用戶信息反饋等動態化因素,對以上問題予以解決。 試驗表明,相較于靜態模型,本文模型能夠更為有效地反映用戶偏好特征的變化。本文算法為空間信息智能分發的用戶建模提供了一個可行的解決方案。 [1] WANG Zegen,HUA Yixin.Research on Technology of Active Spatial Information Service[J].Acta Geodaetica et Cartographica Sinica,2006,35(4):379-389.(王澤根,華一新.主動空間信息服務技術研究[J].測繪學報,2006, 35(4):379-389.) [2] DOUGLASS R J,MORK J,SURESH R.Battlefield Awareness and Data Dissemination(BADD)for the Warfighter[C]∥Proceedings of Digitization of the Battlefield II.Orlando:SPIE,1997:18-24. [3] STEPHENSON T P,DECLEENE B T,SPECKERT G,et al.BADD Phase II:DDS Information Management Architecture[C]∥Proceedings of Digitization of the Battlefield II.Orlando:SPIE,1997:49-58. [4] WU Wei.Development Assumption on Chinese Army’s New Generation Communication Network[J].Journal of CAEIT,2007,2(5):445-449,463.(吳巍.我軍新一代通信網絡發展設想[J].中國電子科學研究院學報,2007, 2(5):445-449,463.) [5] DAWIDOWICZ E.Performance Evaluation of Network Centric WarfareOriented IntelligentSystems[C]∥ Proceedings of the Second InternationalWorkshop on Performanceand Intelligence of Intelligent Systems. Mexico:NIST,2001:73-79. [6] DAWIDOWICZ E,RODRIGU EZ A,LAN GSTON J. Intelligent Nodes in Knowledge Centric Warfare[C]∥Proceedings of the 7th International Command and Control Research and Technology Symposium.Monterey:[s. n.],2002. [7] DAWIDOWICZ E,JACKSON V.The Right Information and Intelligent Nodes[C]∥Proceedings of 8th International Command and Control Research and T echnology Symposium. Washington:[s.n.],2003. [8] GLOBALSECURITY.WIN-TCapabilities[EB/OL].[2011-6-18].http:∥www.globalsecurity.org/military/systems/ ground/win-t-cap.htm. [9] XIA Yu.The User Profile Model for Intelligent Delivery of SpatialInformation[D]. Wuhan:Wuhan University, 2009.(夏宇.面向空間信息智能分發的用戶偏好模型研究[D].武漢:武漢大學,2009.) [10] XIA Yu,ZHU Xinyan,LI Deren,et al.A User Profile Model for Intelligent Delivery of Spatial Information[C]∥Proceedings of Geoinformatics 2008 and Joint Conference on GIS and Built Environment.Guangzhou:SPIE,2008. [11] XIA Yu,ZHU Xinyan,ZHANG Chunlin,et al.Towards IntelligentSpatialInformation Dissemination Based on User Profile Model[C] ∥Proceedings of International Conference on Earth Observation Data Processing and Analysis.Wuhan:SPIE,2008. [12] MOORE R E.Methods and Applications of Interval Analysis[M].Philadelphia:Society for Industrial and Applied Mathematics,1979. [13] HWANG C,YOON K.Multiple Attributes Decision Making:Methods and Applications[M].Berlin:Springer-Verlag,1981. [14] ASNICAR F A,TASSO C.ifWeb:a Prototype of User Models Based Intelligent Agent for Document Filtering and Navigation in the World Wide Web[C]∥Proceedings of 6th International Conference on User Modeling,Sardinia: [s.n.],1997. [15] ZHANGBingqi.The Representation,Acquisition and Inference of Personalized Requirements:A Case Study[D]. Beijing:Graduate University of Chinese Academy of Sciences,2005.(張丙奇.個性化需求的描述、獲取與推斷—案例研究[D].北京:中國科學院研究生院,2005.) [16] YAN Duanwu,WANG Yuefen.Information Acquisition and User Service[M].Beijing:Science Press,2010.(顏端武,王曰芬.信息獲取與用戶服務[M].北京:科學出版社,2010.) [17] ZANG Cheng.Research on Key Techniques of Privacy Preservation in Personalized Search[D]. Hangzhou: Zhejiang University,2008.(臧鋮.個性化搜索中隱私保護的關鍵問題研究[D].杭州:浙江大學,2008.) [18] BILLARD L,DIDAY E.Symbolic Data Analysis:Definitions and Examples[EB/OL].[2011-6-18].http:∥aaron. stat.uga.edu/people/faculty/BILLARD/tr_symbolic.pdf. [19] BILLARD L.Symbolic Data Analysis,What is It?[C]∥Proceedings of Computational Statistics:17th Symposium. Rome:IASC,2006:261-269.3.3 權值向量



3.4 基本區域(區間)單元




4 基于權值衰減函數的模型動態化
4.1 頻譜范圍元素項的分布特征


4.2 空間范圍元素項的分布特征



4.3 時間、空間分辨率元素項的分布特征

5 空間信息的分發決策
5.1 構造決策矩陣

5.2 計算備選方案的效用度

5.3 備選方案的分發
6 用戶反饋引入的模型動態化




7 實例分析




8 結束語