



摘 要: 網絡資源調度過程中存在多處理機同時發生故障的情況,傳統方法在處理多處理機發生故障時,主要分析執行時間和通信時間,未對資源調度的穩定性進行考慮,資源調度存在較高的誤差。為了有效解決資源調度過程中存在的故障問題,設計了基于自適應容錯機制的網絡資源調度平臺。該平臺具有網絡資源發現、網絡網絡資源預約、網絡資源動態信息查詢以及資源調度運行時監控等功能。網絡資源調度模塊的錯誤檢測服務包括進程監控模塊、匯總模塊、錯誤評估模塊以及報警模塊。通過自適應錯誤檢測算法,對網絡資源調度進程中的錯誤進行檢測,并采取對應的解決措施,確保資源調度的順利運行。實驗結果說明,所設計調度平臺在進行資源調度過程中,網絡利用率、調度性能以及可靠性都較優。
關鍵詞: 容錯機制; 網絡資源; 資源調度; 錯誤檢測服務
中圖分類號: TN915?34; TP393 文獻標識碼: A 文章編號: 1004?373X(2016)10?0061?04
Design of network resource scheduling platform based on adaptive
fault?tolerant mechanism
HAN Min, QIAO Lu
(Department of Information Engineering, Henan PolyTechnic, Zhengzhou 450046, China)
Abstract: In order to effectively solve the fault problems existing in the process of resource scheduling, a network resource scheduling platform based on adaptive fault?tolerant mechanism was designed. The platform has the functions of network resource discovery, network resource appointment, network resources dynamic information query, resource scheduling run?time monitoring, etc. The error detection service of the network resource scheduling includes process monitoring module, summary module, error evaluation module and alarm module. The error in the process of the network resource scheduling is detected with the adaptive error detection algorithm, and the corresponding measures are taken to ensure the smooth operation of the resource scheduling. The experiment result shows that the platform has high network utilization, perfect scheduling performance and better reliability in the process of resource scheduling,.
Keywords: fault?tolerance mechanism; network resource; resource scheduling; error detection service
0 引 言
隨著科學技術和通信技術的高速發展,網絡已經成為人們生產和生活必不可少的一部分,網絡資源的高效調度對于提高生產和生活質量具有重要作用。而網絡資源調度過程中存在多處理機同時發生故障的情況,傳統方法處理多處理機發生故障,主要分析執行時間和通信時間,未對資源調度的穩定性進行考慮,資源調度存在較高的誤差[1?3]。網絡資源調度的高可靠性是系統內在要求的關鍵,容錯調度是調度系統實現容錯的有效方法。因此,考慮容錯機制,設計出高質量的網絡資源調度平臺,具有重要應用意義[4?5]。
文獻[6]分析了依據可靠性驅動的動態網絡資源調度方法,該方法在大量資源失敗條件下,基于資源調度可靠性代價為目標,實現非周期的的動態資源實時調度,但是該方法的調度效率較低。文獻[7]提出了基于主動復制策略的List啟發式調度算法,其可將一個資源的N+l個副本調度到不同處理機,但是在劃分資源的大規模副本時,產生了較高的通信消耗和時間復雜度。文獻[8]在啟發式調度算法基礎上,采用新的數據結構處理網絡資源映射到的處理機間的通信關系,降低大量冗余通信,但是存在調度誤差高的缺陷。文獻[9]中的CAFT資源調度方法,其重復考慮資源調度的時間復雜度,將資源多個副本映射到不同的處理機上,但是該方法在調度資源過程中的穩定性較差。
本文設計了基于自適應容錯機制的網絡資源調度平臺,該平臺具有網絡資源發現、網絡網絡資源預約、網絡資源動態信息查詢以及資源調度運行時監控等功能。
1 網絡資源調度平臺的邏輯設計
1.1 網絡資源高度平臺的總體結構
網絡資源調度平臺的總體結構如圖1所示。
在圖1所示的網絡資源調度結構中,網絡資源提交者將資源提交給資源調度程序,資源調度程序從其中的等待調度資源序列中采集有關待調度網絡資源的反映信息以及資源申請信息,在資源提供者中搜索相關的網絡需求。網絡資源調度模塊中的資源匹配子模塊能夠對資源進行匹配分析。資源管理模塊將現場網絡資源調度模塊中采集到的網絡現場資源,傳輸給資源提交模塊,實現網絡資源的有效調度,并將調度結果存儲在數據庫中,同時通過調度結果顯示模塊向用戶提供網絡資源調度結果。
1.2 基于自適應容錯機制的網絡資源調度模型設計
隨著網絡規模的不斷擴大,網絡資源調度故障發生率逐漸增加,引入自適應容錯機制實時檢測故障,有效處理故障形成的不利干擾,確保網絡資源調度的順利進行。
1.2.1 錯誤檢測服務的設計
錯誤檢測服務是自適應容錯機制的關鍵部分,其可實時采集網絡故障資源節點,同時將錯誤信息傳遞到錯誤調控服務,通過錯誤控制服務制定解決方案,完成錯誤的恢復,最終實現網絡資源調度容錯性能。錯誤檢測服務包括進程監控模塊、匯總模塊、錯誤評估模塊和報警模塊,其結構圖如圖2所示。圖2所示的基于自適應容錯機制的網絡資源調度模塊的容錯檢測服務過程為:
(1) 進程監測模塊可檢測到網絡中運行的進程以及對應的資源,采用故障機制檢測網絡資源調度進程的情況,通過將故障信息傳遞給匯總模塊。
(2) 匯總模塊用于采集進程監測模塊傳遞的故障信息,采用合理的方案評估故障信息達到世界的歷史信息,分析后續故障信息到達的時間。
(3) 錯誤評估模塊對網絡資源調度平臺是否存在錯誤進行評估,該模塊對服務器預測的下次故障信息以及故障信息實際到達的實際進行匹配,基于該匹配結果評估是否存在資源調度錯誤。
(4) 通信模塊在存在網絡資源調度錯誤情況下,將錯誤信息傳輸到元計算目錄模塊以及錯誤控制模塊。通信模塊能夠在網絡資源調度過程中對錯誤資源進行標識,并通過錯誤控制模塊針對發生的錯誤進行合理的處理,確保網絡資源調度的順利運行。
1.2.2 錯誤檢測服務的實現
基于自適應容錯機制的網絡資源調度模塊,通過自適應錯誤檢測算法,檢測網絡資源調度進程中存在的錯誤。自適應錯誤檢測算法的思路為:檢測進程P塑造一個滑動窗口其范圍是N,其用作描述近來N次故障消息的傳達,所花費的時間,用t1,t2,…,tn來描述,在任意一個新增故障消息抵達的過程中,會更換掉最初記載的那個時間,通過以上時間的記載,則可獲取臨近兩次故障消息抵達的時間間隙Δt,如果故障消息抵達的時間間隙服從正態分布,則可預測出后續故障消息到達的時間概率,獲取待檢測進程超出時間t的命中率,自適應錯誤檢測算法中的猜測程度函數Φ的分析過程如下:
(1) 檢測網絡資源調度過程p中存儲待檢測過程q近期的N次傳遞的故障消息抵達時間為t1,t2,…,tn;
式中:[Φ(Tnow)]為若網絡資源調度平臺在時刻[Tnow],檢測網絡資源調度進程p未獲取到待檢測進程q反饋的故障消息,則進程p確定進程q存在故障的概率是[Φ(Tnow)]。檢測網絡資源調度平臺是否存在錯誤前,網絡資源調度進程會基于資源調度平臺對錯誤檢測服務的要求,設置合理的閾值[α],因此,在檢測錯誤時,實時對比[Φ(Tnow)]值與[α]值,若[Φ(Tnow)]>[α],則說明被檢測的網絡資源調度進程存在錯誤。
1.2.3 引入自適應容錯機制的網絡資源調度算法
通過1.2.2節的計算結果,將錯誤檢測容錯機制引入網絡資源調度中,具體運行過程為:
(1) 用戶和網絡使用者將資源傳送至調度平臺,并放置在網絡待調度的列表中;
(2) 網絡信息服務依據容錯機制完成資源的檢測,得到有價值的資源列表;
(3) 網絡資源調試模塊依據有價值的資源列表完成資源調度;
(4) 開始調度網絡資源時,根據固定的時間段塑造檢驗點并恢復原始數據錯誤等級是1;
(5) 錯誤檢測模塊根據自適應容錯機制檢測處理單元的錯誤,同時將檢查的信息反饋到錯誤決策模塊;
(6) 在故障消息超出設定時間后,錯誤決策模塊分析出存在錯誤,則執行過程(7),否則說明不存在錯誤,執行過程(8);
(7) 錯誤控制模塊基于NakedJoystick提取對應的容錯方案:
① NakedJoystick=1時,利用檢測點與發生錯誤重試的容錯方案,同時設置NakedJoystick++;
② NakedJoystick=2時,利用檢測點與資源替換的容錯方案,同時設置NakedJoystick++;
③ NakedJoystick=3時代表出現了重大錯誤,這時要利用檢測點與資源復制的容錯方案;
④ 若無綜上情況發生就代表容錯機制運行失敗,資源實施也以失敗告終,執行過程(9)。
(8) 分析是否完成網絡資源調度,若完成則執行過程(9),否則執行過程(6);
(9) 完成網絡資源調度,說明基于自適應容錯機制的網絡資源調度過程結束。
1.2.4 代碼的設計與實現
基于自適應容錯機制的網絡資源調度算法執行過程代碼如下:
Begin
(1) 網絡信息服務依據資源描述信息獲取有價值的資源列表;
(2) 對GA_TS網絡資源進行調度;
MistakeJoystick=2
while(網絡資源未實施結束)
if([t等待>Δt1])
在網絡信息服務里記錄發生錯誤的資源,同時從可用資源列表中清除;
if(MistakeJoystick==2)
JowlScore_Wound;
NakedJoystick++;
else
if(MistakeJoystick==2)
JowlScore_Substitute_Financial;
NakedJoystick++;
Clse
if(nakedJoystick==4)
JowlScore??HrUtilization:
else
容錯機制失效,網絡資源調度失敗;
endif
endif
endif
endwhile
end
2 實驗分析
通過實驗驗證本文提出的基于自適應容錯機制的網絡資源調度平臺設計方法的性能。實驗采用的對比方法為神經網絡方法。實驗從網絡利用率、調度性和可靠性三方面評估本文方法和神經網絡方法的優劣。兩種方法的網絡利用率的實驗結果如圖3所示。
圖3 兩種方法的網絡利用率對比
從圖3中可看出,網絡利用率在開始階段,兩種調度方法的網絡利用率都相對較高,但是隨著調度時間的逐漸增加,兩種方法的網絡利用率都不斷降低,并且本文方法的網絡利用率始終高于神經網絡方法,本文方法能夠充分利用網絡資源完成網絡資源的調度。并且本文方法的變化趨于平穩,說明本文方法能夠很好地完成網絡資源的調度,具有較高的調度均衡性。
如圖4所示為兩種方法的調度性表現,分析圖4可以看出,隨著資源數的增加,本文方法和神經網絡方法的調度性逐漸降低,并且神經網絡方法的調度性能出現顯著的波動,但本文方法的調度性高于神經網絡方法,表明在多資源調度環境下本文方法具有較強的健壯性。
如圖5所示為不同網絡資源調度失敗比率條件下,兩種調度方法的可靠性。從圖5中能夠分析出:隨著資源調度失敗比率的不斷增加,兩種方法的可靠性都有所下降,但是本文方法的可靠性遠遠優于神經網絡方法,特別當通信延遲較高時,說明本文方法具有較高的可靠性。
3 結 論
為了有效解決資源調度過程中存在的故障問題,本文設計了基于自適應容錯機制的網絡資源調度平臺。該平臺具有網絡資源發現、網絡資源預約、網絡資源動態信息查詢和資源調度運行時監控等功能。網絡資源調度模塊的錯誤檢測服務包括進程監控模塊、匯總模塊、錯誤評估模塊以及報警模塊。通過自適應錯誤檢測算法,對網絡資源調度進程中的錯誤進行檢測,并采取對應的解決措施,確保資源調度的順利運行。實驗結果表明,所設計調度平臺在進行資源調度過程中,網絡利用率、調度性能以及可靠性都較優。
參考文獻
[1] 華楠,鄭小平.智能光網絡發展歷程的回顧和展望:從ASON到PCE,再到SDON[J].電信科學,2014,30(2):88?98.
[2] 彭彬,于浩,蘇韻掣,等.基于物聯網的智能廠站位置服務系統[J].電力系統自動化,2013,37(16):114?118.
[3] 魯睿,鄭小平,華楠.多域異構光網絡互連互通管控機制[J].清華大學學報(自然科學版),2013(7):982?990.
[4] WEI Yongjian, GUO Junhu, LI Hui, et al. Experimental demonstration of centralized control mechanism over all?optical network based on OpenFlow protocol [C]// 2014 Optical Fiber Communications Conference and Exhibition. San Francisco, CA: OFC, 2014: 1?9.
[5] 真才基.TD?LTE網絡規劃原理與應用[M].北京:人民郵電出版社,2013:57?59.
[6] 孫維成.云資源調度技術在區域醫療衛生信息平臺中的應用研究[D].青島:中國海洋大學,2013:19?21.
[7] 汪楠.基于OpenStack云平臺的計算資源動態調度及管理[D].大連:大連理工大學,2013:45?50.
[8] 敖文鳳.云計算中基于Hungarian算法的資源獲取研究[D].成都:電子科技大學,2013:21?24.
[9] 石華.異構無線網絡中頻譜資源動態分配[D].西安:西安電子科大學,2014.