程 正
(洪家渡發電廠,貴州 黔西 551501)
ON-CALL系統也稱為在線呼尋系統,其將當下無線網絡技術和尋呼技術相結合,并利用智能移動終端的靈活性、及時性和普遍性,通過語音和短信等方式將發電廠的運行狀態信息、故障等告警信息快速、及時發送給相關處理人員[1-2],該系統具備告警信息存儲和電話終端查詢功能,相關人員可在第一時間查詢告警內容,并迅速到達故障地點,采取相應的解決措施,保證發電廠無人看守時的運行安全[3]。
但是在運行過程中,發電廠ON-CALL監控系統會采集以及存儲海量的告警信息,會導致服務器以及相關運行軟件的運行延遲,甚至產生存儲瓶頸,影響系統的性能[4]。所以,諸多學者設計并優化相關的解決措施,例如盧繼哲等[5]以及曹康華等[6]分別采用基于NTP協議的以及基于虛擬蜜網的用電信息采集方法,以NTP時間同步方法和虛擬蜜網為核心,實現電力相關信息采集,可分別提升信息采集的時間精度和信息安全程度,但是前者不涉及虛擬化設計過程,導致計算時、空間效率較低,后者會造成資源占用過大問題。因此,本文研究發電廠ONCALL系統告警信息采集虛擬化設計與應用方法,其創新之處在于引用基于超融合基礎架構的采集虛擬化設計過程,處理上述的問題,實現一個服務器同時完成多個系統操作的目的,可使虛擬機的安全性和使用性能顯著提升,并且對軟件的虛擬化方案執行的靈活性和可靠性也具有明顯的提升作用。
ON-CALL系統建設部署在發電廠網絡信息管理Ⅲ區,實現將安全控制Ⅰ區的計算機監控系統告警測點信息,通過橫向隔離裝置進行數據傳輸,自動發送到ON-CALL系統應用服務器、電話語音告警應用服務器、手機APP告警信息推送應用服務器,通過短信發送、電話語音、微信、APP信息推送功能向特定人群發送,提供相關人員及時獲取實時生產信息的途徑。
拓撲結構如圖1所示。
圖2中通過計算服務器虛擬化軟件、網絡虛擬化軟件、虛擬存儲軟件、ON-CALL平臺軟件和集群軟件等信息化軟件的充分應用,實現了ON-CALL系統數據采集、處理、存儲發布的冗余配置。監控系統數據采集服務器、ON-CALL系統數據服務器、短信發布服務器、WEB服務器的功能均通過超融合平臺的虛擬化技術實現,還實現內部冗余雙機熱備。

圖1 ON-CALL網絡拓撲圖

圖2 ON-CALL超融合服務器虛擬化網絡圖
橫向隔離裝置:部署A/B網各1臺橫向隔離裝置,實現監控系統控制I區與信息管理Ⅲ區的數據傳輸通道,滿足系統安全防護要求;
ON-CALL系統數據采集服務器(采用超融合平臺):利用超融合平臺部署出2臺數據采集服務器,通過橫向隔離裝置建立與監控系統通信,用于采集監控系統報警信息;
ON-CALL系統數據庫服務器(采用超融合平臺):利用超融合平臺部署出2臺數據庫服務器,同時增加超融全平臺存儲軟件,提供數據的存儲功能,實現雙通道監控系統告警數據采集和數據庫冗余雙機熱備;
ON-CALL系統應用服務器(采用超融合平臺):利用超融合平臺部署出2臺應用服務器,實現信息的發布功能,根據告警級別和告警策略提供給短信平臺發送告警信息;
ON-CALL系統WEB服務器(采用超融合平臺):利用超融合平臺部署出2臺WEB服務器,實現ON-CALL系統的遠程登錄和信息的遠程手動發布功能。
ON-CALL發布方式,實現告警信息的可靠發送。
除通過手機短信發送告警信息外,還實現了電話語音和微信、網絡短信方式告警。
(1)在ON-CALL系統增加1臺語音工控機和語音板卡,建立電話語音數據庫和語音告警子系統,接入廠內程控電話通過專線連接,能將重要故障及事故告警信息通過電話呼叫方式通知到相關人員。
(2)采用超融合平臺,虛擬化1臺微信信息發布服務器,通過微信平臺進行報警信息推送。
(3)通過阿里云的租用,實現ON-CALL信息的網絡短信發布。
采集子系統作為ON-CALL系統的核心部分,是系統告警信息虛擬化采集、存儲、執行的重要保障,且其告警通告模塊具備通告機制,可以根據告警信息的處理結果,自動、靈活地確定通告人員的匹配,實現無人看守的科學、智能的管理[9]。
由于發電廠告警信息量較大,為保證系統以及服務器高效運行,采集子系統融合HCI(見圖3),實現系統告警信息虛擬化采集、計算、存儲、傳輸。

圖3 超融合基礎架構
圖3中,HCI是一種信息基礎架構,結合虛擬計算資源和存儲設備,使計算、網絡、存儲、服務器虛擬化等多種操作和技術可通過一個服務器實現,同時,應用多個服務器的結合構建統一的告警信息資源池,提升系統存儲性能[10],使數據庫的擴展性極大程度提升,且服務器數量越多,計算性能以及存儲性能越高,各個服務器之間可實行告警信息的復制和備份,顯著增加信息的安全性和使用便捷性。
管理子系統中融入HCI后,主要完成4方面的虛擬化處理,分別為采集、計算、存儲以及網絡。
(1)采集虛擬化
在虛擬機上構建虛擬數據采集服務器,涵蓋虛擬CPU、RAM和網絡接口,其應用和操作程序是由數據采集的基本要求決定的,以此作為提供數據采集服務的軟件容器。
大部分物理硬件不具備兼容性、隔離性、封裝性和獨立性的優勢,而虛擬數據采集服務器是由多個虛擬數據采集站組成,每個虛擬數據采集站都存儲著要采集的數據采集站的應用程序和操作系統,無硬件結構,擁有全軟件性,可以通過虛擬數據接口接收并發送到數據庫進行并行存儲。
(2)計算虛擬化
計算虛擬化可使虛擬數據采集服務器擁有虛擬化程序,完成虛擬數據采集服務器的虛擬化,將其轉變為邏輯資源,使硬盤、CPU等分開運行的物理資源能夠服從統一管理[11],可以在1臺物理服務器上建立相互隔離、同時運行的虛擬機執行環境,提高資源利用率和系統性能,降低復雜度,高效可靠地完成系統服務。
(3)存儲虛擬化
以分布式存儲技術為主,加入能夠提升服務器硬盤性能的SSD讀寫緩存加速技術以及可將信息數據存儲至數個服務器硬盤中的多副本機制技術,實現存儲虛擬化[12],它可以將所有服務器的存儲空間結合起來,形成一個共享的告警信息存儲資源池,大大提高告警信息的存儲和安全性,保證相關服務的有效執行。
(4)網絡虛擬化
為了提升網絡的傳輸效率,降低網絡連接和轉換模式,可根據需求自動實現網絡調用,構建共享網絡,如圖4所示。
圖4中,在應用程序和存儲服務器中,以多臺服務器為聯結點,將虛擬機與共享網絡結合起來,降低網絡連接和轉換模式。

圖4 超融合網絡結構
發電廠告警信息數據在傳輸過程中會存在誤差,因此基于ON-CALL系統的數據傳輸特點,采用DLPTP時鐘同步機制的對時方法作為采集子系統對告警信息采集的控制機制[13]。該方法采用點對點方式作為電廠主站與各監測采集點之間的通信方式,完成告警信息的采集,提高了網絡信道傳輸時延的計算,避免了傳輸誤差。
根據定制的DLPTP協議算法,反復計算時鐘誤差,對采集終端和電能表的時鐘進行校正,其主要步驟如下:
(1)采集終端接收由主站發送的報文,且具有時間標簽t1,并將t2作為接收到報文的時間。
(2)采集終端將一幀對應的報文回傳至主站,主站完成報文接收,并且將回傳的時間和接收的時間記錄為t3和t4。
(3)主站向采集終端傳送時間報文,且該報文屬于一幀數據域內,內容和時標分別為t4和t5。
(4)接收報文后,采集終端將該時間標記為t6,以此采集終端共獲取6個時間標記,分別為t1、t2、t3、t4、t5、t6,并根據t6-t5和t2-t1之間是否存在等同關系,判斷網絡信道在時鐘同步時的狀態。
(5)若結果表示信道為穩定狀態,則網絡之間的延時為:((t4-t1)-(t3-t2))/2;采集終端的時鐘修正為:t5+((t4-t1)-(t3-t2))/2。若結果表示信道為不穩定狀態,則采集終端對主站回應無效,則需讓主站重新履行上述流程,該實行次數可根據實際情況設置。
(6)成功完成采集終端時鐘同步修正后,需對電能表的時鐘實行定時抄讀,將抄讀結果與采集終端的時鐘對比[14],加入其超過設定閾值,則采集終端向主站上報以此形成的時鐘異常事件。
(7)主站利用DLPTP協議算法,采取其和采集終端同步的方式,對時鐘異常事件實行同步處理,同步流程如圖5所示。

圖5 同步流程圖
告警識別是在對采集到的告警信息進行挖掘的基礎上,確定告警事件的類型,這是告警通知的前提。利用關聯規則算法對告警信息數據進行挖掘,得到數據中的關聯規則[15],并根據不同的告警因素完成告警信息分類。
第k種告警信息和其對應的權值分別用ik和wk表示,則H={h1,h2,...,hm}和W={w1,w2,...,wm}分別表示每一種告警信息的分類集合和全部告警對應的權值集合。采用時間跨度interval對告警數據實行劃分處理,形成告警集g,且該處理根據時間順序完成;k項告警頻繁項目集用L表示,其組成的元素{hj1,hj2,...,hjk}(1<jk<m)為H中的k個不同告警,并且該元素符合最小支持度小于、元素之間的告警規則為:

挖掘告警數據關聯規則算法的詳細計算過程如圖6所示。
(1)采用時間跨度interval對告警數據實行劃分處理,將告警集中冗余、重疊的告警類別刪除后形成告警集g,且該處理根據時間順序完成。
(2)對g實行查找,獲取頻繁項目集L1,且屬于1項。
(3)為獲取Lk(k≥2)項告警頻繁項集Lk,在Lk-1為k-1項告警頻繁項目集的前提下,對g實行查找完成,停止條件為獲取的為空集。
(4)將告警頻繁項目集實行融合,即L=L1∪L2∪...Lm(1<n<m)。

圖6 關聯規則挖掘算法流程
(5)對L中的各個元素Lk實行遍歷操作,獲取符合最小置信度的告警關聯規則的元素,并對實行求解,重復該操作,當該項集中所有元素都完成遍歷則停止。
(6)向規則庫中輸入遍歷獲取的符合標準的告警關聯規則。
以此獲得將告警信息分類結果,經超融合共享網絡實現發電廠ON-CALL系統告警信息采集虛擬化。
以某發電廠的機組(2×25 MW、4×125 MW)作為實例測試對象,驗證本文方法的應用效果。
該發電廠要求ON-CALL系統各項功能必須滿足運營需求標準,信息采集時的延時誤差不可超過1 s,且必須保證ON-CALL系統的存儲性能。
測試應用本文方法后ON-CALL系統各項功能的應用性能,主要從系統告警用戶管理、告警資料管理、告警信息發布、手機終端信息發布幾方面完成,測試應用本文方法后ON-CALL系統功能是否滿足使用標準,結果如表1所示。
根據表1的測試結果可知,應用本文方法后,ON-CALL系統的告警用戶管理、告警資料管理、告警信息發布、手機終端信息發布幾方面功能的使用性能良好,能夠滿足用戶使用標準。
選取文獻[5]和[6]的基于NTP協議的用電信息采集系統的時間同步方法和基于虛擬蜜網的用電信息采集系統攻擊檢測方法作與本文方法進行對比,統計3種方法應用后的告警信息對時采集的誤差,見圖7。

圖7 3種方法應用后系統對時采集誤差平均值
根據圖7的測試結果可知,應用本文方法的ON-CALL系統在進行不同次數的時鐘同步時,最小平均誤差和最大平均誤差分別為0.08 s和0.16 s;應用另外2種對比方法的系統最小平均誤差和最大平均誤差分別為1.06 s和1.48 s、1.08 s和1.56 s;應用本文方法的ON-CALL系統的平均誤差最小,顯著優于2種對比方法,誤差均在0.2 s以內,符合使用需求標準。
在進行大型數據量的操作時,ON-CALL系統的空間效率是影響其運行的重要指標。為測試應用本文方法的ON-CALL系統告警信息分類計算性能,連續3個月內采集大小為20 GB的告警信息時的內存使用情況,統計3種方法應用后的系統空間效率,結果見圖8。

圖8 應用3種方法后系統占用內存對比結果
根據圖8的測試結果可知,應用本文方法后,ON-CALL系統在進行較小數據量的告警信息分類計算時,與應用2種對比方法后的系統占用情況較為接近,差距極??;但是隨著數據量的增加,應用本文方法的系統占用內存逐漸降低,而應用2種對比方法的系統占用內存呈上升趨勢,這是由于本文方法采用關聯規則對告警信息頻繁項集實行挖掘,可有效忽略冗余告警集,并且通過基于超融合基礎架構的采集虛擬化設計過程,極大程度降低對內存占用率,使系統具備良好的空間效率。
為測試本文方法的虛擬化能力,測試應用3種方法后系統在相同情況下的運行結果,如表2所示。

表2 應用3種方法后系統的虛擬化測試結果
根據表2測試結果可知,應用本文方法的ONCALL系統優于應用其他2種對比方法的系統虛擬化效果,是因為超融合基礎架構可有效提升數據中心的運行效率,其虛擬化效果更為顯著。
發電廠ON-CALL系統是實現無人看守時監控告警的重要手段,但是其需要采集的告警信息數量巨大,為實現更好的告警信息采集和處理,發電廠ON-CALL系統引入基于超級融合基礎架構的告警信息采集虛擬化設計過程,應用一個服務器同時完成多個系統操作目標,實現采集、計算、存儲以及網絡的虛擬化,保證系統的最佳運行,可實現告警信息的實時采集,為該領域的相關研究提供參考。