[摘要] 文章介紹了一種基于代理的網格資源搜索模型,詳細闡述了該模型資源搜索的原理。應用該模型可以有效地提高網格資源發現的效率。
[關鍵詞] 網格; 代理; 網格資源搜索; MRD
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 22. 042
[中圖分類號]TP31 [文獻標識碼]A [文章編號]1673 - 0194(2011)22- 0073- 02
1引言
網格是把分布在不同地理位置上的計算資源通過互聯網整合成一臺巨大的超級計算機,實現各種資源的全面共享。網格資源管理系統的基本功能是接受來自網格用戶的資源請求,并且把特定的資源分配給資源請求者,合理調度相應的資源,使請求資源的任務順利地執行。
本文介紹了一種基于代理的網格資源的搜索方法。
2基于代理的網格資源搜索模型
在基于代理的網格資源管理模型中,用戶只需要將任務提交給資源請求代理,而代理的背后有多少個資源提供方,各個資源的性能和任務被分配到哪臺處理機上執行等對于用戶來說都是不透明的。計算資源構成一個分級的網狀結構,包括若干個代理以及在這些代理注冊的大量計算資源。所以,單純依賴集中式索引服務可能出現資源搜索瓶頸和實時性狀態反映差的問題。基于代理的網格資源搜索模型,在MDS分層樹狀結構的集中式索引服務的基礎上,應用P2P技術解決集中式資源發現機制中可能出現的上述兩個問題,具有良好的適應性和伸縮性。基于局部性原理的多級回答域網格資源搜索方法,與現有網絡搜索方法相結合,極大地提高了網絡資源搜索效率。
3基于代理的網格資源搜索方法
3.1MRD方法原理
在計算機硬件體系結構的Caching技術中,系統總是把當前訪問的局部指令和數據調度到一級Cache,而把更常使用的放入距CPU更近的速度更快的二級Cache中,以此類推。MRD網格資源搜索方法中,查詢節點首先應用P2P的Flooding方法獲得大量響應節點,它們就將組成MRD算法的多級回答域。
根據查詢響應信息的Hops數值不同。Hops是一個在1~7之間的代表響應節點與查詢節點邏輯距離的跳數,可以把所有響應節點都歸入多級回答域,如三級MRD算法的1~M~N~7,其中N~7為一級回答域(1MRD),M~N為二級回答域(2MRD),1~M為三級回答域(3MRD)。
MRD方法認為,所有的響應節點都是查詢者感興趣的Popular節點,從興趣或邏輯距離上來講,3MRD距離自己最近,2MRD次之,1MRD最遠,但其都屬于當前節點的回答域。從數量上講,通常3MRD最少,2MRD次之,1MRD最多。
節點再次查詢時,就首先向3MRD發出查詢;如果沒有命中或命中數量不足,再向2MRD發出查詢;如果還是沒有命中或命中數量不足,再向1MRD發出查詢;如果仍然沒有命中或命中數量不足,就在全網執行Flooding操作。
向MRD節點發出查詢請求時,其TTL數值不是7,而是比相應級差小的一個數值:如3MRD中為 ≤ M - 1;2MRD中為 ≤ N - M;1MRD中為 ≤ 7 - N。這樣,用極其少量的查詢消息就覆蓋了幾乎所有感興趣的資源范圍。這和Caching技術的原理和道理是完全一樣的。一般情況下MRD級數與Hops保持一致,但查詢者可以根據自己偏好和網絡傳輸速度等因素,重新調整MRD級數;通過有選擇地劃定查詢目標區域的MRD方法,能夠有效提高查詢命中率。
3.2MRD方法評價
(3) 正態分布均方差σ,表示資源的集中程度,σ越小,表示資源越集中于MRD附近,局部小區域的Flooding的TTL值Ti就可以越小,即網絡代價越小,RSE就越高。
(4) 泊松分布的均值方差λ,λ越小,表示資源越集中于高級MRD中,即Cache的命中率越高,網絡代價就越小,搜索結束時n值就越高,即在更高級的Cache中就獲得了足夠數量的結果。
(5) 隨著搜索范圍的擴大,n值越小,所發出的消息數目越多,而獲得的結果越少,所以搜索效率反而越來越低。
(6) 如果把MRD方法結合進Routing算法中,保持越頻繁的響應者距離自己越近,即把最高級的MRD作為查詢節點的直接鄰居,可以促使整個網絡系統盡快進入穩定狀態。
3算法總結
與Flooding相比,MRD方法保持甚至加快了查詢結果的響應速度,降低了網絡帶寬資源的消耗。