張正文,李 津,孫樹娟
(國網雄安新區供電公司,河北 保定 071600)
隨著云服務在互聯網上日益占據主導地位,以及基于云服務的物聯網的出現[1-4]。預計到2021年,云數據中心流量將占數據中心總流量的95%[5]。隨著萬物物聯理念的提出,電網作為傳統行業,也在積極的對自身進行升級和改革[6-7]。為了解決海量數據處理造成的流量大、時間長等問題[8-9],在此智能電網引入了多站融合的概念,通過將分布密集的變電站建設運營成為數據中心等,從而解決該問題。但一個數據中心擁有數千臺服務器、存儲設備、冷卻設施和電力變壓器,數據中心部門估計占全球電力消耗的1.4%。如果直接將變電站轉化為數據中心,而不是考慮給其分配有限能量,這可能導致發電站超載,對電網造成嚴重破壞,同時,還可能剝奪更需要電力的其他數據中心的能量。為了克服這一問題,提出了一種針對數據中心用電量的博弈論方案(G-Power),其中每個數據中心由博弈中的一個參與者表示。該方案的基本思想是根據數據中心的收費優先級、關鍵運行應用程序的優先級和其他數據中心的優先級3個指標為每個數據中心分配最優的功率,以達到公平的功率分配。
在提出的系統中,智能電網控制器(公用事業公司)負責供電,響應用戶的用電需求。電力來自與云數據中心通信的多個發電站(雙向通信)。因此,智能電網控制器可以查看每個數據中心的電源行為。智能電網和云數據中心的系統架構如圖1所示。
在提出的系統中,數據中心的目標是購買最大功率,以便為其存儲的能量充電并處理最大的應用程序。這將提高云提供商的利潤。此外,每個數據中心都試圖增加其充電狀態并以自私的方式要求電力,而不考慮計劃用于數據中心的有限能源。這可能使發電站過載,并對電網造成嚴重損害。
在這里介紹了G-Power的原理,首先用非合作博弈理論對數據中心的功率分配進行了建模。因此,考慮對策:G=(I,Si,gaini)i∈T,其中I表示一組玩家(數據中心),d1,d2,…,dn,其中n是參與博弈的數據中心的數量。

在提出的方案中,設計了回報函數來反映4個主要函數:第1個函數計算數據中心對具有高功率的需求(效用函數);其余3個函數是優先級成本函數,分別計算數據中心收費優先級的成本、關鍵應用程序優先級的成本以及總關鍵應用程序優先級的成本。支付函數包括以下4個函數。
(1) 效用函數。在G-Power中,效用函數被建模為,當每個參與者增加其電力需求值時,會獲得更多的利潤。在網絡研究中常用的效用函數[16],選擇使用對數函數來設計G-Power的效用函數。因此,選擇一個效用函數:
γi(xi)=log(xi+1),?i∈I
(1)
式中,xi為玩家di需求的電量。
(2)數據中心的費用函數優先權。該函數定義了玩家根據其電量需求xi和其收費優先級Dvi支付的懲罰。在提出的方法中,優先級是根據活躍服務器ASi和玩家di的荷電狀態SoCi計算的,具體公式見式(2):
(2)
因此,有以下函數:
ρi(xi,Dpi)=xi×Dpi
(3)
(3)關鍵應用程序優先級的成本函數。在這個優先級成本函數中,考慮了一個玩家di的關鍵運行應用程序。在G-Power中,將實時應用程序視為關鍵應用程序。該功能基于玩家的電量需求xi及其關鍵應用優先Api。將優先級Api計算為關鍵應用程序記錄Critical_appsi占總應用程序記錄Total_appsi的比率。因此,定義函數如下:
σi(xi,Ani)=xi×Ani
(4)

(5)
(4)總關鍵應用優先級的成本函數。該優先級成本函數基于玩家功率量需求xi及其總關鍵應用優先級TPi。優先級TPi是玩家關鍵應用與所有玩家關鍵應用之和的比率。因此,有以下成本函數:
τi(xi,Tpi)=xi×Tpi
(6)
(7)
在定義了玩家di的4個函數之后,可以得出支付函數:
gaini(xi,x-i)=αiγi(xi)+βiρi(xi,Dpi)+ωiσi(xi,Api)+ψiτi(xi,Tpi)
(8)
其中,x-i={xk}(k∈i)且是除玩家di外的所有玩家的電力需求量(策略)向量。s=(xi,x-i)是策略配置文件。αi,βi,ωi和ψi分別是γi,ρi,σi和τi的玩家偏好系數。這些參數的設置是為了滿足系統的目標和要求,例如,當ωi值越大,獲得具有高關鍵應用率的玩家和那些具有低關鍵應用比率的玩家的功率之間的差異就越大,反之亦然。
在博弈論中,納什均衡(NE)是一個基本概念,常用于預測所有參與者的未來行為和確定永久狀態。這意味著博弈中的每個玩家都沒有興趣改變自己的策略,并執行相同的操作。因此,如果存在一個NE,則非合作博弈有一個解。在G-Power的對策G=(I,Si,gaini)i=T中,如果沒有一個玩家能夠通過改變策略來增加其收益,那么一組策略代表一個NE。

(9)
綜上所述,在計算G的對策解之前,證明了NE的存在性和唯一性。

當時,每個參與者的策略集是閉有界的。那么,集合Si,?i∈I是緊的。
考慮2點y1,y2∈Si和ε=[0,1]。因此,得到

通過計算s={xi},?i∈I的增益的Hessian矩陣,可以證明的支付函數的凹性如下:

(10)

(11)
因此,可以看到H(S)對于所有策略s∈S是負定的,因此,gainxi,x-i)在Si,?i∈I中是嚴格凹的。 根據Nikaido-Isoda定理[10],G-Power的博弈G至少具有一個NE。
(2)納什均衡的唯一性。設u=(u1,u2,…,un)是正參數的隨機向量,使用Rosen定理[11]來得到支付函數的加權正和,其定義如下:
(12)
這里δ(xi,x-i;u)偽梯度給出的:
(13)
并且
(14)
另外,g的Jacobian矩陣J(xi,x-i;u)可以定義如式(15)所示。

(15)
式中,Bij=uiDij,?i,j∈I。
由此可見,對于所有對稱矩陣是負定的。因此,函數是根據Rosen定理(18)對角線嚴格凹的。因此,博弈G在其純策略空間中具有唯一的NE,這也符合Rosen定理。
(16)
約束條件為:
為了解決問題(F),使用拉格朗日乘子法使G-Power的函數在2個不等式約束下最大化。引入了2個拉格朗日乘子λi和li,函數可定義為式(17):
(17)
因此,對于每個玩家di,G-Power的拉格朗日函數滿足以下KKT條件,如式(18)所示:
(18)

(19)
在這里條件1和條件2可以用公式(20)和(21)表示:
βiρi(xi,Dpi)+ωiσi(xi,Api)+ψiτi(xi,Tpi≥αi
(20)
(21)

圖2分別使用式(2)、式(5)和式(7)顯示了每個數據中心在1 d內不同的成本(數據中心的費用優先級、關鍵應用程序優先級和總關鍵應用程序優先級)。

圖2 數據中心成本變化
可以觀察到,在每個數據中心,數據中心的收費優先級在非高峰時段較低,而在高峰時段較高。這可以解釋為這樣一個事實:數據中心沒有太多活動服務器,在非高峰時間存儲能量,相反,在高峰時間,數據中心已對其能量進行了充電并擁有大量活動服務器。另一方面,關鍵應用程序和總的關鍵應用程序優先級在非高峰時段較高,而在高峰時段較低。這意味著,與數據中心中運行的應用程序總數相比,在高峰時段運行的關鍵應用程序要比在非高峰時段運行的應用程序多得多。
圖3描述了使用基于博弈的功率分配方案在一個特定小時內(0:00)4個數據中心的功率分配??梢钥吹剑珿-Power方案根據每個數據中心的優先級成本進行了公平的分配。

圖3 基于博弈的電量分配
與自私方案的性能比較如圖4所示。

圖4 與自私方案的性能比較
圖4(a)顯示了隨機選擇的一個數據中心,G-Power與自私方案的功率分配比較。可以觀察到自私方案總是以所需的總功率供應,而不管數據中心有什么關鍵應用或能量消耗。這可能會使電網過載并使發電站超載。另一方面,在G-Power中分配的能量隨著時間的推移而變化,可能會減少到1.27 MW。這通常發生在非高峰時段(例如圖4(a)中的3:00),此時數據中心正在充電,并且沒有很多正在運行的應用程序。此外,它可能會達到最大值5 MW,如上午11:00和19:00。所呈現的結果是由于提出的方案中使用的博弈論,該方案考慮到:①每個數據中心的活動服務器和充電狀態;②在數據中心運行的關鍵應用程序;③在所有數據中心運行的關鍵應用程序,如圖4(b)、圖4(c)和圖4(d)所示。在圖4(b)中顯示了根據數據中心在活動服務器和充電狀態方面的收費優先級的功率分配值??梢钥吹?,在G-Power中,分配的電力隨著優先級的降低而減少。然而,自私方式方案在不考慮任何優先級的情況下,總是具有穩定的功率分配。此外,圖4(c)和圖4(d)還表明,關鍵應用程序優先級和總關鍵應用程序優先級分別與功率分配成反比關系。當一個玩家的關鍵應用程序增加時,它的能力就會增強,反之亦然。
本文研究了智能電網與云數據中心之間的交互作用,以獲得公平的功率分配。將數據中心的功率分配建模為一個非合作博弈。證明了納什均衡的存在性和唯一性。然后計算分配給每個玩家的最佳功率。仿真結果表明,與其他方案相比,該方法能顯著降低電網負荷。