賀春光 謝曉琳 安佳坤 韓文源 劉鵬 孫鵬飛 石亞欣 吳莉莉



摘 要:基于我國電網運行效率低、指標體系建立具有局限性的狀況,首先提出了一種基于大數據的電網運行效率指標篩選方法,通過指標篩選,建立了一套可靠有效的評價指標體系;然后經指標歸一化處理、指標權重計算,對指標體系中各指標進行詳細的評價分析;最后將此指標體系用于河北省電力公司,對其進行綜合評分,列出評分結果。該實例結果驗證了基于大數據建立的指標體系的可靠性和有效性。
關鍵詞:電網運行效率 指標體系 大數據 指標歸一化 有效性
中圖分類號:TM769 文獻標識碼:A 文章編號:1674-098X(2016)12(b)-0001-03
隨著國民生活質量的逐漸提高,用戶用電量與日俱增,電網的投資規模也逐漸擴大,如何以最小的投資滿足國民用電需求、提高電網運行效率[1]顯得愈發重要。若要提高電網的運行效率,首先應建立一套科學的電網運行效率指標體系,并對其進行有效分析,即電網運行效率指標評價。目前大多數對電網運行效率的評價方法都較單一,建立的指標是從固定指標里抽取出來的,這樣的指標具有局限性,不能全面描述電網的運行效率。該文針對這種指標局限性,創新性地提出了一種基于大數據的篩選指標、建立指標并評價指標的方法。
1 基于大數據的指標篩選
目前科學技術快速發展,“數據爆炸”[2]這一名詞日益為人們所熟悉,它是在現代技術“互聯網”“物聯網”“云計算”等的推動下快速發展起來的,現在就是一個“得數據者得天下”的社會,電網也應抓住時代機會,利用“電網互聯”獲得的數據對電網進行有效的分析。
“大數據”一般指的是需要處理的信息量較大、超出一般電腦處理數據內存量的數據,由于目前大數據還處于初步研究階段,其定義尚未達成共識,但它在互聯網、科技與國防軍事、政府管理等領域已成為信息化改革的核心。電力大數據有著大數據的特點,即數據數量多、數據類型多、價值數據少、數據處理速度快等。電力系統中的數據主要來源于發電、輸電、變電、配電、用電等環節中連接的傳感器和測量儀器儀表。
所有電力網中的電力數據的集合即為電力大數據,基于這些數據進行系統的分析,利用相關分析法全范圍地抽取有效的電網運行效率指標,且這些指標間相互獨立——即基于大數據的電網運行效率指標,它不再是人為地認定某些指標比較重要,而是利用大數據全范圍地抽取有效指標。這種基于大數據的指標篩選,不僅充分彌補了人為篩選指標的局限性,更可以很好地反映電網運行效率。
2 電網運行效率評價模型的構建
基于大數據的指標,數量既多又雜,有些指標可能無效或指標間可能有關聯,若直接將這些指標用于指標評價,會因部分數據重復而影響評價結果,因此,構建科學有效的電網運行效率評價模型,則必須提前對這些指標進行處理,處理的過程包括:(1)指標簡約;(2)指標歸一化;(3)指標的權重計算;(4)綜合評分。
2.1 指標簡約
對大數據的所有指標進行初步篩選,篩選出與電網運行效率有關的指標,由于數據量龐大,這個過程由計算機完成。假設初步篩選出的指標有p個,這些指標間可能存在關聯,因此,需對其進行指標簡約。將p個指標進行分類,設分為m類,則有指標矩陣:
(1)
其中:第一行、第二行、第m行分別代表第一類、第二類、第m類指標,代表第一類、第二類、第m類指標的個數,且。
求各個指標的相關性矩陣。每兩個指標間都有一個相關系數γ,γ的取值可以表示兩個指標間的相關程度,其計算公式如下:
(2)
其中:γ的取值范圍為[-1,1]。當γ為正值時,表示兩個指標呈正相關;反之,為負相關。|γ|越接近于1表示兩個指標的相關性越強,當時,表示兩個指標完全相關;當時,表示兩個指標完全不相關,即相互獨立;當時,表示兩個指標基本不相關;當時,表示兩個指標低度相關;當時,表示兩個指標顯著相關;當時,表示兩個指標高度相關。式中的、代表同一類指標中任意兩個指標x、y的第i個采樣值,、為這兩個指標采樣值的平均值,其計算公式如下:
(3)
(4)
其中,n為指標的采樣數量,將公式(3)和(4)中的值帶入公式(2),可以計算出每兩個指標間的相關系數,將這些相關系數按照一定的順序排列,即可形成指標的相關性矩陣,如表1所示。
相關性矩陣中,代表的是類指標中第p個指標和第q個指標間的相關系數,同一個指標間的相關系數為1。根據相關性矩陣中相關系數的數值對指標進行約簡,約簡原則如下。
(1)對于相關系數大于0.8的兩個指標,刪除一個,保留一個。
(2)對與任何兩個以上指標的相關系數都處于0.5~0.8之間的指標進行刪除。
按照以上的原則進行篩選后的指標,即為基于大數據約簡后的指標。
2.2 指標歸一化
指標體系中,各指標類型可能不同,比如絕對量型指標、無量型指標和比值型指標,這些指標屬性不同,數據范圍差異大,不便于指標評價的后續計算,因此,須對這些指標數據進行歸一化處理。其步驟如下。
(1)確定指標的閾值。
根據經驗值將不合理的數據剔除,剩下的數據按照其范圍進行分組,統計落在各組內的頻數,將頻數最大組的上下限作為該指標的閾值。
(2)確定指標的隸屬度函數。
根據指標的數據情況來擬合指標的隸屬度函數,其可以為線性或非線性,當數據不充足時可選擇線性函數。隸屬度函數分為戎上型、戎下型和中間型,根據指標的特性來選擇,如:正指標選擇戎上型;逆指標選擇戎下型;適度指標選擇中間型。
2.3 指標權重計算
各指標對電網運行效率的影響程度有差異,因此需對其進行權重分配。該文采用變異系數法對各個指標的權重進行計算,可以避免指標數據的量綱和數量級不同帶來的影響。
變異系數法根據指標的變異程度來對其進行權重分配,即直接將變異系數法處理后的數據作為其權重系數。變異系數越大,則其對應的指標對評價的影響也就越大。設有P個電網運行效率指標共分為m類,指標矩陣如公式(1),計算權重過程如下。
(1)計算各指標的標準差。
(5)
其中,為某一類指標中第i個指標的標準差,為該指標的第i個采樣值,為該指標的平均值,其計算如公式3。
(2)計算各指標的變異系數。
(6)
其中,為某一類指標中第i個指標的變異系數。
(3)各指標變異系數的歸一化處理。
(7)
其中,為該指標的權重系數。
2.4 綜合評分
線性綜合評分方法有著直觀、易實現的優點,且與實際工作相似,因此,該文采取該方法對各個電力公司進行綜合評分。其計算公式如下:
(8)
其中,y為某一電力公司的綜合評分,p為該公司的電網運行效率指標總數,為第i個評價指標值,為其權重系數。
3 實例分析
以2014年河北電網220 kV電壓等級的運行數據為依據,基于大數據和相關性分析篩選出電網運行效率指標,其有效指標如表2所示。基于這些指標對河北省6個地市公司指標約簡前和指標約簡后分別進行評分,并將評分進行對比,其評分結果如表3所示。
由表2可知,基于大數據共篩選出13個電網運行效率指標,構成電網運行效率的指標體系,這些指標之間相互獨立,且各指標對電網評價的影響權重不同,表中指標是按照權重分量依次遞減排序,權重分量總和為1。
通過對各電力公司的實際調研可知:表3的地市公司評分結果與實際情況較為接近,基本反映了各地市公司電網運行效率的情況。地市6、3、1、4,其所處位置為城區,經濟較發達,工業化發展快,電力需求量和售電量較大,變壓器效率高,線損率低,因此其綜合評分較高;地市2、5,其電網結構中農網比例較大,雖然電網投入增加,但售電量增量相對緩慢,且設備的利用率低,線損率大,導致其綜合評分較差。
4 結語
通過對我國電網運行現狀的研究,了解到電網運行效率的評價指標選取不完善,提出了大數據概念,并基于大數據對電網運行效率的指標進行相關性篩選,建立了一套可靠的電網運行效率指標體系;然后進行指標歸一化、指標權重計算,對該指標體系進行評價;最后將此指標體系用于河北省電網公司,對其電網運行效率綜合評分。實例結果表明了基于大數據的電網運行效率指標評價的有效性和可靠性,為電網的投資提供了有力的依據。
參考文獻
[1] 宋伶俐,鄧長虹,吳耀文,等.基于相關性分析法的電網設備運行效率評價指標[J].中國電力,2012(9):85-90.
[2] 馬坤隆.基于大數據的分布式短期負荷預測方法[D].湖南大學,2014.