龐 鶴
(中博信息技術(shù)研究院有限公司,江蘇 南京 210000)
我國的電力系統(tǒng)在新時代取得了快速發(fā)展,形成了以特高壓為中心,其他子電網(wǎng)互相連接的基礎(chǔ)架構(gòu)[1-4]。另外,由于各種分布式電源技術(shù)的發(fā)展,風(fēng)力發(fā)電、光伏發(fā)電等可再生能源逐漸投入使用,擴展了傳統(tǒng)發(fā)電方式。更多樣的發(fā)電方式、更大的電網(wǎng)規(guī)模加上電力市場的改革,都需要電網(wǎng)系統(tǒng)在供電能力上有更高的水平[5,6]。顯然,傳統(tǒng)電網(wǎng)技術(shù)無法滿足更高的要求和未來的發(fā)展需要。智能化是現(xiàn)代科學(xué)技術(shù)發(fā)展的潮流,智能化電網(wǎng)也不例外,將經(jīng)典的電網(wǎng)系統(tǒng)與新興技術(shù)相結(jié)合,能夠?qū)﹄娋W(wǎng)企業(yè)的運營提供一定程度的技術(shù)支持和探索[7-10]。在考察了目前電網(wǎng)自動化系統(tǒng)發(fā)展和運行的需求后,提出了一種基于云計算的智能電網(wǎng)調(diào)度系統(tǒng)。
智能調(diào)度系統(tǒng)的總體架構(gòu)如圖1 所示。該平臺可以共享多個系統(tǒng)之間的信息,以此協(xié)調(diào)各系統(tǒng)之間的工作,并且建立收集數(shù)據(jù)和業(yè)務(wù)信息的中間平臺,能夠整合電網(wǎng)的信息。

圖1 智能電網(wǎng)調(diào)度系統(tǒng)
智能調(diào)度系統(tǒng)在云端基礎(chǔ)架構(gòu)中,只有被選中的管理節(jié)點具有不同的結(jié)構(gòu),其他普通節(jié)點的結(jié)構(gòu)都是相同的。
本實驗設(shè)計的調(diào)度系統(tǒng)采用分布式文件系統(tǒng),其原因是該系統(tǒng)具有自監(jiān)控、自檢測能力,并且當(dāng)硬件在運行過程中產(chǎn)生故障導(dǎo)致系統(tǒng)癱瘓時,可以即時恢復(fù)。另外,該系統(tǒng)采用一次寫入、多次讀出的數(shù)據(jù)讀寫方式,編程模型采用Map-Reduce 模型,該模型常被用于大規(guī)模數(shù)據(jù)的并行運算。它具有以下幾個主要功能:一是系統(tǒng)會自動分析出一個作業(yè)中的大數(shù)據(jù)塊,并將其分割成多個小塊,每個小塊對應(yīng)一個任務(wù),之后自動調(diào)動計算節(jié)點處理這些任務(wù);二是系統(tǒng)能夠進行代碼和數(shù)據(jù)之間的互相定位,從而減少數(shù)據(jù)通信;三是系統(tǒng)通過合并中間結(jié)果來減少數(shù)據(jù)通信的開銷,并且為了防止數(shù)據(jù)相關(guān)性問題,輸出中間結(jié)果時會進行一定的劃分處理;四是為了增加數(shù)據(jù)存儲的可靠性,采用多備份冗余存儲機制,該機制的特點就是能夠及時檢測出錯誤數(shù)據(jù),并對它進行修復(fù)。
智能電網(wǎng)調(diào)度系統(tǒng)功能的實現(xiàn)需要4 個子系統(tǒng)協(xié)同工作,分別是管理數(shù)據(jù)的數(shù)據(jù)交換與共享子系統(tǒng)、管理資源調(diào)度和負(fù)載分配的子系統(tǒng)、儲存大量數(shù)據(jù)的存儲子系統(tǒng)以及用于運算的集成運算子系統(tǒng)。智能電網(wǎng)調(diào)度系統(tǒng)的功能架構(gòu)如圖2 所示。

圖2 智能電網(wǎng)調(diào)度系統(tǒng)功能架構(gòu)
(1)數(shù)據(jù)交換與共享子系統(tǒng)。該子系統(tǒng)管理云計算環(huán)境下各個分布式平臺之間的數(shù)據(jù)交換和共享。為方便電網(wǎng)調(diào)度員對子系統(tǒng)的管理和操作,調(diào)度命令可以跨級通信。
(2)動態(tài)負(fù)載均衡與資源調(diào)配子系統(tǒng)。該子系統(tǒng)管理資源調(diào)度和負(fù)載的動態(tài)分配,其資源調(diào)度作用如下:當(dāng)系統(tǒng)的某個節(jié)點或任務(wù)由于分配的資源不夠而難以繼續(xù)正常運行時,調(diào)度系統(tǒng)利用其調(diào)度模型進行資源計算,將資源不足的部分調(diào)到其他有足夠計算資源的工作區(qū)中,由這些工作區(qū)分擔(dān)計算職責(zé),直到這部分完成任務(wù)為止。
(3)海量數(shù)據(jù)存儲子系統(tǒng)。該子系統(tǒng)用于存儲調(diào)度系統(tǒng)的大數(shù)據(jù),特別是操作或者運算過程中的中間數(shù)據(jù)。這些中間數(shù)據(jù)的快速讀寫和管理關(guān)系到整個系統(tǒng)的正常運行,也便于對大數(shù)據(jù)進行規(guī)律辨識等后續(xù)工作的開展。
(4)集成計算子系統(tǒng)。該子系統(tǒng)集成了各種類型的計算資源,主要與資源調(diào)配子系統(tǒng)協(xié)同工作,當(dāng)需要進行可利用資源任務(wù)計算時,該子系統(tǒng)會分解計算任務(wù)到對應(yīng)的工作區(qū)中,從而增加了計算效率和分析速度。
因為簡單直觀、連接方便等優(yōu)勢,選擇交換機為調(diào)度系統(tǒng)的中心架構(gòu)(數(shù)據(jù)轉(zhuǎn)發(fā)的任務(wù)全部落在交換機上而不分配給服務(wù)器)。云端容錯性采用基于糾刪碼的方法,糾刪碼是一種前向錯誤糾正技術(shù),主要是防止網(wǎng)絡(luò)傳輸過程中的丟包,可以提高存儲系統(tǒng)的可靠性,這個技術(shù)兼顧了可靠性和數(shù)據(jù)冗余度。
本研究構(gòu)建的智能調(diào)度系統(tǒng),最基礎(chǔ)的目標(biāo)是要滿足500 臺以上云終端的接入需求。這就要求智能調(diào)度系統(tǒng)具有電網(wǎng)內(nèi)部信息交互能力、電網(wǎng)與外部網(wǎng)絡(luò)的交互能力以及能夠滿足電網(wǎng)特殊客戶需求的能力。該系統(tǒng)的設(shè)計理念基于操作層面的虛擬機,能夠建立和運行一個在完全封閉環(huán)境中的完整計算機系統(tǒng),因此虛擬機完全獨立,主要用來提升主機的運行速度。對于虛擬機的管理問題,本研究引入了OpenStack 技術(shù)搭建的基礎(chǔ)平臺,該平臺的特點是具有強開放性,隨時都可以根據(jù)需要進行擴容。
為了確保同一個HA 下的機器在遭遇意外情況時不至于同時死機,需要各個機器不使用同一個不間斷電源(Uninterruptible Power Supply,UPS)和防雷裝置,這就要求硬件進行分布式部署。管理群的部署為“3-3-3”結(jié)構(gòu),即部署3 臺服務(wù)器,每臺服務(wù)器完成同樣的工作。這些工作交給3 臺虛擬機,每臺虛擬機運行3 類服務(wù),包括K&H 服務(wù)、父Cell 服務(wù)和子Cell服務(wù)。通過負(fù)載均衡技術(shù)將任務(wù)平均分配給各組。
本研究采用Ceph 構(gòu)建存儲子系統(tǒng)。Ceph 是一種分布式存儲系統(tǒng),可以聯(lián)結(jié)多臺服務(wù)器組成一個大資源池,再根據(jù)用戶的需要按需分配。其優(yōu)點如下:一是支持3 種存儲接口,分別是對象存儲、塊存儲、文件存儲;二是采用CRUSH 算法,數(shù)據(jù)具有高并行度,并且分布均勻,大大降低了數(shù)據(jù)維護難度;三是具有高度的數(shù)據(jù)一致性;四是由于沒有固定的中心節(jié)點,能夠靈活的擴展集群。Ceph 是一種性能優(yōu)秀且可靠的分布式文件系統(tǒng),能夠滿足本研究的需要。智能電網(wǎng)云平臺訪問數(shù)據(jù)的輸入/輸出通路如圖3所示。

圖3 智能電網(wǎng)云平臺訪問數(shù)據(jù)的輸入/輸出通路
關(guān)于存儲選擇,考慮到成本和存儲容量之間的取舍,本研究使用混合存儲,即同時使用機械硬盤和固態(tài)硬盤,選擇的型號為SATA 7200RMP 機械硬盤和SATA 固態(tài)硬盤。由于是混合存儲,需要考慮2 類硬盤的優(yōu)缺點,機械硬盤讀寫較慢但是存儲可靠性高,當(dāng)硬盤損壞時也有恢復(fù)手段,于是用于存儲Ceph 方案中的數(shù)據(jù);而固態(tài)硬盤讀寫速度快,但可靠性和可恢復(fù)性不如機械硬盤,多用于存儲方案中的日志。
基礎(chǔ)服務(wù)群相比集成的計算節(jié)點群,需要有更高的可靠性,因此需要統(tǒng)一采用實機安裝。基于計算速度考量后,計算節(jié)點不用實機而是采用虛擬機。
控制節(jié)點包括網(wǎng)絡(luò)基礎(chǔ)服務(wù)節(jié)點和OpenStack 控制節(jié)點,這2 類節(jié)點分別都有3 個,前者不需要進行復(fù)雜運算,所以相比高性能,更需要極高的可靠性。
Fuel 節(jié)點側(cè)重于輸入/輸出通路帶寬,該節(jié)點對硬件配置有較高的要求,需要高速的網(wǎng)絡(luò)、硬盤和運行內(nèi)存。
針對以下5 種可能會發(fā)生的問題,本研究對平臺云計算緩存采取下列優(yōu)化措施。
(1)節(jié)點過熱。若個別節(jié)點的容量耗盡,且具有很大的并發(fā),則增加虛擬節(jié)點個數(shù)。
(2)緩存預(yù)熱。若線上壓力過大,需要對集群進行擴容,則需要對服務(wù)器預(yù)熱。
(3)分散部署。由于服務(wù)器不會占用過多中央處理器(Central Processing Unit,CPU)和磁盤資源,這極易性能浪費,需要盡可能多的部署服務(wù)器。
(4)緩存雪崩。為了預(yù)防機器死機時造成的請求處理拖慢緩存,需要預(yù)留足夠多的內(nèi)存冗余,參考閾值為70%。
(5)緩存穿透。在某些情況下,應(yīng)用發(fā)出的請求會直接進行數(shù)據(jù)查詢,然后返回一個NULL 結(jié)果,從而導(dǎo)致大量的無用空查詢,這會加大系統(tǒng)的壓力。可以采用緩存NULL 結(jié)果的方法來解決這個問題。
在設(shè)計完電網(wǎng)調(diào)度系統(tǒng)后還需要對系統(tǒng)在高負(fù)荷狀態(tài)下的各個指標(biāo)進行性能測試,如性能、配置等。使用網(wǎng)絡(luò)服務(wù)壓力工具(Web Serve Stress Tool,WSST)進行性能測試,WSST 能夠模擬大量用戶訪問系統(tǒng),創(chuàng)造了一個模擬的高負(fù)荷環(huán)境。
本次實驗選擇逐步加壓的壓力測試,并發(fā)系統(tǒng)訪問用戶(Vuser)按照2 s 的周期啟動,約在8 min后,所有的Vuser 都會被啟動。該過程中,設(shè)置系統(tǒng)能夠自動執(zhí)行用戶登錄操作。另外,具有不同權(quán)限的用戶,其訪問請求時間也不同,下面是測試準(zhǔn)備和場景部署。
(1)隨機選擇2 臺性能正常且能夠穩(wěn)定運行的計算機,根據(jù)查閱的資料,每臺計算機需要部署大約80 個Vuser。
(2)隨機選擇一臺性能良好的計算機,該計算機除了需要部署60 個左右的Vuser 外,還需要作為上位機對測試工具進行控制,并且在本機上觀察測試情況。
場景吞吐量測試結(jié)果如圖4 所示。由圖4 可知,場景吞吐量隨著時間先上升,再下降到一個平穩(wěn)狀態(tài)直至結(jié)束,這是由于Vuser 隨著時間增加而增加,在Vuser 全部登錄后就進入了穩(wěn)定運行狀態(tài)。

圖4 場景吞吐量測試結(jié)果
智能技術(shù)的迭代更新和電網(wǎng)規(guī)模的擴大,都使得電力數(shù)據(jù)信息分布更廣、數(shù)量更大、結(jié)構(gòu)更復(fù)雜,這就要求更高的信息處理能力,然而傳統(tǒng)的電網(wǎng)控制技術(shù)已經(jīng)無法滿足需求。為提高電網(wǎng)的智能化水平,嘗試在電網(wǎng)控制上結(jié)合云計算技術(shù)以提高電網(wǎng)調(diào)度的能力。本研究以接入500 個云終端作為基本目標(biāo),以結(jié)合云技術(shù)為主要創(chuàng)新,設(shè)計一套智能電網(wǎng)調(diào)度系統(tǒng),并進行了算例驗證,結(jié)果驗證了該系統(tǒng)的可行性。