姜賓
(國網山東省電力公司莘縣供電公司,山東 聊城 252400)
作為智能電網的重要組成部分,用電信息采集系統直接關系智能電網的堅強、穩定運行。隨著近年來我國用電信息采集系統正式進入深化應用階段,圍繞多業務高效協同處理關鍵技術開展的研究日漸受到業界關注,圍繞用電信息采集系統多業務高效協同處理關鍵技術開展研究具備較高的現實意義。
前置通信服務管理平臺、業務應用平臺、數據平臺屬于用電信息采集系統的具體構成,而為了在這種構成下實現業務高效處理,集群、批量數據處理等技術的支持必不可缺。
(1)集群技術。集群技術存在兩種運行方式,分別為主/從方式、主/主方式,其中主/主方式的應用最為廣泛,這是由于該方式在硬件資源利用方面具備明顯優勢,主/主方式因此具備較高可用性。圍繞主/主方式構成的模型進行分析不難發現,模型中的每個節點容量均會被提前定義,節點故障時則能夠實現節點任務的自動暫時移交,雖然在此情況下部分節點性能會稍有降低,但用電信息采集系統的數據處理穩定性卻能夠得到較好保障。值得注意的是,雖然主/從方式能夠通過設置備用節點避免故障時系統性能的下降,但由此導致的投資擴大卻使得該運行方式僅適用于故障狀態下性能要求較高的情況。
(2)批量數據處理技術。批量處理技術同樣屬于用電信息采集系統中常見的數據處理技術,該技術主要用于系統過于龐大數據的處理、入庫、查詢、分析等工作,而為了最大化發揮批量數據處理技術效用,數據庫優化必須得到高度關注,這里的優化主要包括表結構優化、數據表合理管理,前者主要負責各表間關聯關系的合理設置、數據表存儲量的合理控制(一般不超過2G),而后者則需要引入分區技術進行物理意義上的數據分隔,由此即可實現快速查詢、磁盤I/O使用減少。
(3)并行計算技術。隨著采集終端的大量接入,并行計算技術開始廣泛應用于用電信息采集系統領域,其中并行計算技術主要負責采集任務并行化處理,其計算流程可大致描繪為:“終端→終端接入→終端數據采集→終端數據轉發→負載均衡→并行處理集群→采集計算節點→規約適配→規約解析→指令封裝”,結合這一流程可直觀發現負載均衡策略在其中的應用價值,圖1為負載均衡策略模型。結合圖1模型不難發現,節點不過載時一般選擇靜態均衡,具體的均衡策略選擇則需要結合實時監測流量。

圖1 負載均衡策略模型
(4)網絡負載均衡技術。分布式數據庫存儲系統大量應用于用電信息采集系統領域,而這種應用便需要得到網絡負載均衡技術的支持,靜態均衡算法(I/O調度策略)、動態均衡算法(負載調節措施)等則屬于網絡負載均衡技術的主要應用形式。其中,靜態均衡算法具備原理簡單、系統開銷較小優點,但無法結合系統狀態改變均衡策略使得其應用效果穩定性較差,靜態均衡算法因此多用于負載特性相對穩定系統;而動態均衡算法則具備實時最優調節能力且對系統負載情況具備較強依賴性,這使得其多用于負載波動性大或異構系統。
為提升研究的實踐價值,選擇了日負荷曲線作為電力負荷分類特性指標,希望由此開展的不同類型用戶分離探索所涉及的多業務高效協同處理關鍵技術能夠為相關業內人士帶來一定啟發。
(1)電力負荷特性分析。結合《電力工業生產統計指標解釋》,即可了解電力負荷特性具體劃分與組成,基于行業用途可以將電力負荷劃分為工業負荷、農業負荷、商業負荷、城鄉居民及其他負荷,其中工業負荷可進一步細分為重工業負荷與輕工業負荷,而商業負荷則可以細分為賓館等負荷、寫字樓與大型商場等負荷。結合基于行業用途的電力負荷劃分不難發現,現階段電力負荷劃分標準較為粗糙,這種粗糙分類無法較好滿足用電信息采集系統的高質量應用需要。深入分析不難發現,現階段我國基于電力用戶性質、營銷業務需求情況將電力用戶分為六大類別,分別為大型專變用戶、中小型專變用戶、三相工商業用戶、單相工商業用戶、居民用戶、公用配變考核計量點,雖然該劃分較好,體現了不同客戶用電習慣,但海量采集數據出現對高精度數據分類提出的挑戰必須得到關注。
(2)k_means優化算法。k_means屬于用電信息采集系統領域較為常見的聚類算法,該算法具備大數據處理效果較好、效率較高且具有可伸縮性的特點,但初始聚類中心的隨機選擇、聚類個數K需要提前設定屬于該算法存在的不足,因此本文基于密度法的初始中心點進行了k_means算法的優化,這一優化需首先假定樣本數據集X,其中,由此定義相異度矩陣D、領域半徑MeanDist、核心點對象含有數據對象的最少數目MinPts,即可為k_means優化算法的實現提供基礎支持,其中:

而密度參數的計算公式則為:

通過具體試驗可以確定,基于密度法的k_means優化算法免去初始聚類中心的隨機選擇,這就使得k_means優化算法大大提高了聚類質量與穩定性,傳統k_means算法初始聚類中心隨機選擇對聚類結果造成的負面影響也由此得以順利消除。為實現更進一步的k_means算法優化,本文開展了BWP、DBI、距離代價函數、Silhouette、基于GSA的肘形判據等聚類有效指標的特點分析,并選擇了合適的指標函數作為聚類結果評價性指標,而由此開展幾種評價指標的簡要分析,即可發現常用的評價性指標為輪廓系數,而BWP、基于GSA的肘形判據指標在應用中均存在各具特色的表現,因此對三種指標進行了實驗對比。具體實驗中,以輪廓系數為聚類效果評價指標的運行總時間為8.9647s,而以BWP為聚類效果評價指標的運行總時間則為6.2814s,而基于GSA的肘形判據指標運行總時間為6.1617s。開展對比分析可以直觀發現,基于輪廓系數的聚類效果評價指標、基于BWP的聚類效果評價指標受到的初始聚類中心隨機性影響較大,由此引發的穩定性問題將直接降低判斷準確性,而基于GSA的肘形判據指標卻不存在這類問題,因此肘形折角判據可較好服務于最佳聚類個數的確定。結合上述分析不難發現,k_means優化算法的應用流程可描述為:“開始→對象數據集→K=1→開展計算→K≥定值→gap>gap(2)-sd(2)→Kopt=1”,而通過這一系列流程,即可保證k_means優化算法具備聚類結果準確、質量高、無偏差等優勢。
(3)電力負荷曲線聚類。對于本文研究的用戶日負荷特性研究對象來說,受各類干擾因素影響、數據量較大屬于其主要特點,用戶日負荷特性因此天然具備較高分析難度,而這便需要應用降維技術,由此通過較低維度數據向量表示用戶日負荷曲線,即可保證用電信息采集系統更高質量運行。具體來說,需采用主成分分析法進行用戶電力負荷曲線聚類,這里的主成分分析法是一種典型的多元統計分析方法,將原數據樣本的高維度信息轉換為一組新的互不相關的低維指標進行表示屬于該方法的特點,而這正是主成分分析法能夠較好挖掘數據對象信息間潛在影響和關聯的原因所在,而結合上文提及的k_means優化算法,即可保證改進算法更好服務于海量電力負荷的更高質量、更高效率聚類,隨著我國電力用戶及采集終端的不斷增加、新型業務的不斷出現,本文提及的用電信息采集系統多業務高效協同處理關鍵技術將有廣闊的應用前景。
綜上所述,用電信息采集系統多業務高效協同處理關鍵技術具備廣闊應用前景,本文提及的電力負荷特性分析、k_means優化算法、電力負荷曲線聚類等內容,提供了可行性較高的技術探索路徑建議,而為了推動我國電力事業的進一步發展,業界還應圍繞管理策略、云計算技術、系統功能擴展開展更深入研究。