鄭 鴻
[摘要]設計一個網格資源管理器模型,并對其各組件的功能實現進行介紹。
[關鍵詞]網格 GlobusToolkit4 資源管理器
中圖分類號:TP3文獻標識碼:A文章編號:1671-7597(2009)0510015-01
一、引言
網格(Grid)是將分布在不同地理位置的計算資源,通過高速的互聯網組成充分共享的資源集成,從而提供一種高性能計算、管理及服務的資源能力。網格技術是繼Internet技術和Web技術之后的第三代互聯網技術,它能夠最大限度的實現網絡資源共享和調度,給計算機用戶帶來最好的上網服務。網格是對互聯網技術的又一大進步,是第三代互聯網大浪潮。
由于各種資源、管理機制、用戶和應用程序間存在大規模的異構性,使得網格的資源管理比分布式或集群計算環境下的資源管理更加復雜,因此建立適應于網格環境的資源管理系統模型,研究其特征及功能,為具體實現網格資源管理系統是很有必要的。
二、網格資源管理器模型
網格資源管理是網格的重要組件,本文設計的網格資源管理器的結構如圖1所示。該資源管理器采用層次式的結構,為用戶提供了資源發現、作業提交、作業管理和監控等功能。整個調度模型由作業收集器、信息采集器、作業調度器、作業管理器、調度記錄器以及數據庫組成。

三、網格資源管理器功能描述
1.作業收集器
作業收集器是整個全局調度器面向用戶的接口。作業收集器負責收集用戶提供的作業名稱、位置,執行程序所需的參數,作業結果文件的名稱與路徑等信息。并存入作業信息數據庫,為作業調度服務。
2.信息采集器
資源信息采集器主要是針對網格系統中的節點及節點信息進行查詢。網格節點的信息由動態信息和靜態信息組成。動態信息按照一個固定的時間間隔采樣得到,比如CPU、內存的利用率、作業隊列長度等。由于動態信息對網格資源調度起著重要的作用,因此需要保證動態信息的實時性。靜態信息是不會隨時間變化的信息,比如內存大小、硬件類型,操作系統等,這些信息在資源獲取時一次采樣得到。本文采用GlobusToolkit4中的信息服務組件MDS4實現了網格信息的收集和發布。
3.作業調度器
作業調度器負責具體資源的選擇,由作業調度、容錯機制和反饋機制組成。作業調度功能是把等待執行的作業從作業隊列中取出,然后組成等待隊列。然后根據調度策略選擇合適的資源節點,生成調度結果。容錯機制功能是當作業運行失敗后,調度器要進行容錯處理。當運行過程中監控到某個節點失效時,將該節點上的失敗作業重調度到另一節點上,保障網格系統全局的負載平衡。如果在一個有效期內收不到某節點的狀態信息,也認為該資源失效,把調度到該資源上的所有作業重新加入作業隊列。反饋機制功能是對于執行完成的作業,根據反饋的執行時間信息,可以調整等待隊列中類似作業的時間信息。同時,調度器還會把作業和作業分配時資源的信息記入數據庫,為未來作業的調度提供依據。
4.作業管理器
作業管理器包括作業提交器和作業監控器兩部分的功能。作業提交器的作用是對作業生成RSL文件,然后向具體的資源節點提交。同時提交器還要把調度信息記寫入調度日志中,當作業完成后,提交器還負責結果的收集,無論作業成功或失敗都提供在線結果信息。作業監控器的作用就是監聽作業狀態信息,以便能及時對失敗的作業進行容錯處理。網格作業的基本狀態包括:Submitted,Pending,Running,Done,Failed。作業狀態的轉換情況是一旦提交作業,狀態將顯示為Pending,如果已經開始執行,則將作業從Pending表中刪除,而在Running表中添加該作業,表示正在運行。如果該作業的當前狀態為Done或Failed時,則將該作業Running表中刪除,同時更新網格作業信息,將作業狀態更新為相應的狀態。
5.調度記錄器
調度記錄器的作用是用來記錄調度結果,保障調度執行。包括調度標識、作業標識、資源標識、作業描述、作業狀態、提交時間等方面。由于網格資源的動態性和不穩定性,會出現資源故障或退出的情況,如果通過資源監控發現某個資源節點失效,那么作業調度器將根據調度日志生成重新生成RSL請求,產生調度結果。
四、小結
網格資源管理系統目前絕大多數的研究僅僅是局限于理論或原型系統,建立一個適應于網格環境的資源管理系統模型,研究其特征及功能,為具體實現網格資源管理系統起到舉足輕重的作用。本文設計的網格資源管理器已經應用到信息處理和計算網格中去,并取得了一定的效果。下一步工作是在資源描述、容錯處理等方面進行研究,進一步優化和完善該資源管理器。
參考文獻:
[1]田志民、趙劍、翟正利等,面向服務的網格資源管理模型研究[J].計算機應用研究,2006,04:25-27.
[2]李培峰、朱巧明、支麗艷,面向信息服務的網格資源管理器的設計[J].計算機工程,2008,03:49-51.
[3]金海、陳剛、趙美平,容錯計算網格作業調度模型的研究[J].計算機研究與發展,2004,08:1382-1388.
[4]林琳、唐闊、胡亮、范溯,遠程調用方法及其在Globus Toolkit4中的應用[J].吉林大學學報(信息科學版),2007,06:617-624
作者簡介:
鄭鴻,男,廣東饒平人,廣東工業大學2009級軟件工程碩士班學員,研究方向:軟件工程、網絡技術。