武靜 丁星 朱宏濤



摘 ?要: 針對當前大型云計算平臺資源利用率相對較低的特點,提出一種改進后的負載分類模型,結合LR模型與ARIMA模型,以獲得更優的云計算平臺動態負載均衡。通過分析云計算負載的均衡流程,改進現有的負載分類模型;以LR模型與ARIMA模型作為分類選擇,通過MATLAB2014R完成對云計算資源調度的優化模型實驗。實驗結果表明,改進模型明顯優于現有模型,證明了該模型的有效性。
關鍵詞: 云平臺; 負載分類; 負載預測; LR模型; ARIMA模型
中圖分類號:TP391.9 ? ? ? ? ?文獻標識碼:A ? ? 文章編號:1006-8228(2020)01-14-05
Abstract: In view of the current characteristics of low resource utilization of large cloud computing platforms which leads to waste, this paper proposed an improved load classification model, and combined with LR model and ARIMA mode to obtain better dynamic load balance. By analyzing the load balancing process of cloud computing, the existing load classification model was improved; using LR model and ARIMA model as the classification selection, MATLAB2014R was used to realize the cloud computing resource scheduling optimization model. The experimental results show that the improved model is obviously superior to the existing model, which proves the effectiveness of the model.
Key words: cloud platform; load classification; load prediction; LR model; ARIMA model
0 引言
云計算通過虛擬化技術,將大型數據中心的物理資源虛擬化成資源池,并將資源池中的資源以服務的形式租賃給用戶,為用戶托管云信息平臺上的文件和應用程序提供服務[1]。近年來云計算技術迅速發展,云計算在現代的互聯網科技中扮演著越來越重要的角色。由于云計算的分布式特性及彈性、高效的資源管理能力,云計算越來越受到應用信息領域的重視。其中如何實現計算資源的有效動態配置和共享使用成為當前云計算技術的主要研究課題[2]。云平臺服務應用的增加使其負載數據呈現出明顯的異構性和動態性,這使得各種應用的負載變化模式之間產生較大差別,單一預測模型已經不能很好地兼顧預測精確度與時間性能[3]。
1 相關理論
云計算是Kaur和Luthra[4]提出的一種基于internet的計算模型,在網絡上以低成本高效共享計算資源或服務。云基礎設施支持虛擬化文件共享,云用戶通過虛擬化訪問存儲在服務器上的資源和文件。其中高效的資源調度和負載平衡是云平臺實現高效共享的主要內容,目前已有研究工作主要針對云環境下的資源調度或負載均衡展開。
Assi [5]等人使用一種分解方法解決了云中的可伸縮流量管理(STM)問題,降低最大鏈路負載,保證網絡用戶之間的負載平衡;Dhinesh Babu L.D.[6]等人提供了一個使用蜜蜂行為的云環境中任務調度的視角,利用蜜蜂的行為來獲得最佳的機器利用率。V. Priya[7]等人提出了基于模糊的多維資源調度和排隊網絡(F-MRSQN)方法,提高資源利用率并減少作業提交響應時間;史振華[8]針對云平臺負載結合人工蜂群算法和SVM算法,提出IABC算法。
時間序列預測技術在云計算的負載均衡研究上也得到了大量的應用。Tofighy S[9]等提出了一種基于云資源使用歷史的集成CPU負載預測模型,利用貝葉斯信息準則在每個時隙中選擇最優的組成模型;Zhong W[10]等提出了一種基于加權小波支持向量機(WWSVM)的云負載預測模型,用于預測云數據中心的主機負荷序列;Amiri Maryam[11]等提出了一種基于序列模式的預測模型;江偉[12]等提出了一種基于自回歸模型和Elman神經網絡的預測模型,其使用ARMA模型來預測,再使用Elman神經網絡對ARMA模型的誤差進行預測,通過修正ARMA的輸出值得到最終的預測值;劉春紅[13]提出了一種基于任務時間尺度差異的負載分類模型。
2 負載分類模型
2.1 負載分類模型
在云平臺負載預測系統中,用戶的任務申請會經過接入控制進入負載均衡器,經過配置、監控、預測分類完成負載預測的過程。圖1描述了云平臺負載分類方法各組件間相互通信的工作過程。
該現有的負載分類模型較好實現了負載預測模型的分類,但該模型存在資源利用率低,資源浪費等缺陷。該模型中沒有設置時間參數來平衡不同算法的時間性能,并且存在一個不合理的參數C,需要對這些不足進行改進。時間性能是評價一個算法是否優良的重要指標,對于現有的算法模型,提升它的時間性能有時是比較困難的。但對于負載分類模型,可以通過優化不同模型的分配方案,來達成對于模型時間性能的優化結果?,F有的負載分類模型不能完好地比較出兩種不同的負載模型在時間性能上的差距,因此可以考慮引入新的參數來平衡時間性能的影響。選取1000組實驗數據,統計對于不同模型時間性能的測試結果,并計算不同模型預測時間的均值。設參數[uj]作為不同模型時間性能的權重,其數值取不同模型的統計的預測平均時長均值。將[uj]作為不同模型在負載變化率的權重,再通過L2范數防止數據的過擬合,能夠提升分類模型的泛化能力,從而平衡預測的準確性和時間性能。參數C表示的是任務優先級對于模型選擇的影響,其定義如下:
[Ai]的優先級為[pi],云平臺的優先級區間為[a,b],[pi∈a,b]。[p*i]是[pi]的標準化值,[p*i=pi-ab-a]。[Ω]是高優先級任務的集合,[Ω_]是低優先級任務的集合。min1和min2分別是兩個集合的負載平均變化率的值,[θ1]和[θ2]是閾值。表1從數據集中高優先級任務與低優先級任務各隨機選取的500組數據,統計其高負載變化率于低負載變化率的占比。從表中可看出,任務優先級與負載變化率存在一定的關系,但將任務優先級作為負載分類的依據則會導致結果產生一定程度上的誤差,從而影響結果的可靠性。
3 負載分類預測算法
負載分類模型對不同的作業匹配相應的預測模型以實現最優化目標,當添加新作業或者一個舊作業完成時,都需要重新確定[xij]的取值來分配預測模型算法?,F有的LR模型的特點為模型較為簡單,運行速度快,較為適合用于預測波動較小,負載變化率較低的數據,但當遇到負載波動較大的數據時則會產生較大的誤差;SVM模型的目標是對特征空間劃分最優超平面,最大化分類邊際的思想是SVM方法的核心,當使用SVM模型算法訓練較小的數據集時,會得出較為出色的結果,但SVM模型對于較大的數據訓練集的效果并不佳,時間性能和預測準確度都會出現較大幅度的波動。本文研究的分類預測模型采用LR模型與ARIMA模型的組合,ARIMA模型的基本思想是將預測對象隨時間推移而形成的數據序列視為一個隨機序列,用一定的數學模型來近似描述這個序列。相比原模型采用的SVM模型,ARIMA的模型較為簡單,在計算的時間維度上優于SVM模型,對于大型的數據集的處理具有更加穩定的效果,從而減少因為訓練集變大而產生的誤差。LR模型采用如下的表達形式:
[cε___t]的值越低,預測的總誤差就越小,模型的預測就越準確。在預測周期內對數據集中應用負載分類模型的任務均勻的選擇了20個時刻,預測20個時刻負載,并計算在這20個時刻時的累計誤差,結果如圖2所示。結合LR與ARIMA的優化模型預測累積誤差最低,單一LR模型與ARIMA模型預測誤差較高,結合LR與SVM的現有分類模型與結合LR與SVM的預測分類模型對比,優化后的模型的預測累計誤差顯著小于現有模型。由表2,與LR模型、ARIMA模型及現有分類模型相比,結合LR與ARIMA負載分類模型的平均誤差減少了151.17%、73.76%、38.18%。對于大型的負載預測,單一預測模型比分類預測模型的累計誤差大的多。本文提出的模型較大程度上優化了原有模型的性能。
5 結束語
本文重點研究解決了云計算環境下的負載預測問題,提供了一種改進后的負載預測分類模型?;谠心P唾Y源利用率較低,資源浪費等特點,添加了[u]參數作為兩個不同的預測模型時間權重,移除了原模型中不合理的參數C產生的影響,并使用ARIMA模型替代原模型中的SVM模型。通過與原有模型對比,可知優化后的模型在相同的[λ]值時比原模型顯著的減少了38.18%的實驗誤差,證明了優化后的模型的可靠性與可行性。優化模型能夠有效地提升負載預測的準確度。在考慮預測誤差與時間尺度的基礎上,接下來可進一步考慮更多的針對實際運行中的云平臺對負載預測產生影響的因素。
參考文獻(References):
[1] Chang B R,Tsai H F,Chen C M.Evaluation of virtual machine performance and virtualized co-nsolidation ratio in cloud computing system[J].J-ournal of Information Hiding and Multimedia Si-gnal Processing, 2013.4(3):192-200
[2] Coutinho EF,Sousa FRD,Rego PAL,et al.Elasticity in cloud computing:a survey[J].ANNALS OF TELECOMMUNICATIONS-ANNALES DES TELECOMMUNICATIONS,2015.70(7-8):289-309
[3] Al-Dhuraibi,Y.,Paraiso F,Djarallah N,et al.Elasticity incloud coputing :state of the art and research challenges[J].IEEE Transctions on Services Coputing,2018.11(2):430-447
[4] Amandeep Kaur,Mr.Pawan Luthra.A review on load balancing in cloud environment,Internati-onal Journal of Computers & Technology,2018.17(1):7120-7125
[5] Chadi Assi,Sara Ayoubi,Samir Sebbah,Khaled S-haban,Towards scalabletraffic management in cl-oud data centers,IEEE Trans.Commun.2014.62(3):1033-1045
[6] L.D.Dhinesh Babu, P.Venkata Krishna,Hone-y bee behavior inspired loadbalancing of tasks in cloud computingenvironments,Appl.Soft Comp-ut.2013.13:2292-2303
[7] V. Priya,C.Sathiya Kumar,Ramani Kannan.Resour-ce scheduling algorithm with load balancing for c-loud service provisioning,Applied Soft Computing Journal,2019.76:416-424
[8] 史振華.云計算中基于IABC算法的負載預測的研究[J].計算機測量與控制,2018.26(9):195-199
[9] Tofighy,S,Rahmanian,AA,Ghobaei-Arani,M.An ens-emble CPU load prediction algorithm using a Ba-yesian information criterion and smooth filters in a cloud computing environment[J].Software Prac-tice&Experience,2018.48(12):2257-2277
[10] Zhong W,Zhuang Y,Sun J,et al.A load prediction model for cloud computing using PSO-based we-ighted wavelet support vector machine[J].Applied Intelligence,2018.48(11):4072-4083
[11] Amiri M,Mohammad-Khanli L,Mirandola R.An o-nline learning model based on episode mining f-or workload prediction in cloud[J].Future Generat-ion Computer Systems-The International Journal OF Escience,2018.87:93-101
[12] 陸兵.基于云計算的邊防信息資源管理服務平臺架構設計[J].計算機時代,2017.10:40-43
[13] 陳斌,甘茂林,李娟.一種基于負載均衡的云資源調度方法[J].計算機技術與發展,2017.27(6):51-55
[14] 田宏偉,解福,倪俊敏.云計算環境下基于粒子群算法的資源分配策略[J].計算機技術與發展,2011.21(12):22-25
[15] 任神河,鄭寇全,關冬冬,惠軍華.基于IFTS的云計算網絡動態負載均衡方法[J].系統工程理論與實踐,2019.39(5):1298-1307