999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于RF-CPSO-LSSVM 的日線損率置信區間預測研究

2020-08-08 03:14:04
浙江電力 2020年7期
關鍵詞:特征模型

(國網浙江海寧市供電有限公司,浙江 海寧 314400)

0 引言

低壓配電網線損是國家電網有限公司經濟效益考核的重要指標。電網線損的計算通常由兩部分組成,一部分是理論線損;另一部分是管理線損[1-3]。其中理論線損指的是電力在輸送過程中,由電力設備造成的電力損失,也稱為技術線損;管理線損指的是在技術層面之外的電力損失,包括設備故障、采集故障、竊電等造成的電力損失。因此,對理論線損的研究能夠反映電力網的真實線損水平,為電力企業的線損治理工作提供理論支撐。

理論線損的計算通常需要綜合考慮負荷情況、運行方式和拓撲情況等數據,對電網的數據基礎要求高。傳統的計算方法有潮流算法、積分電流法和等值電阻法[4-5],這些算法能夠精確計算電力網的電力損失。

然而,在實際的生產環境中,數據缺失較為嚴重,因此有學者提出了基于統計學的計算方法,如使用回歸算法、聚類算法、神經網絡算法和支持向量機[6-8]等。文獻[9]針對10 kV 配電網理論線損預測提出了一種基于PSO(粒子群算法)優化BPNN(BP 神經網絡)的方法,全局搜索BP 神經網絡的權值和閾值來構建PSO-BPNN 線損評估模型,進而對測試樣本集線損進行預測;文獻[10]提出一種基于FOA-SVR(系統聚類和果蠅優化支持向量回歸機)的配電網理論線損計算方法,將樣本數據聚類分成相似的群組,主要使用果蠅優化算法,訓練尋找最優的計算參數,以得到最優結果。雖然上述算法能準確地估計臺區的線損,但是均需要幾個月的長期數據,對于長期數據缺失嚴重的部分臺區則不適用[11-13]。

本文分析了國內外理論線損率預測目前的研究現狀,在此基礎上,運用RF 算法對造成理論線損的特征進行篩選,采用CPSO(混沌粒子群)算法對LSSVM(最小二乘支持向量機)算法的懲罰因子C,g 進行參數尋優,得到不確定性理論線損預測模型。通過計算求得理論線損率的置信區間概率預測。

1 隨機森林特征選擇

使用RF(隨機森林)算法進行特征選擇時,當一個影響預測準確率的重要特征加入噪聲后,RF的分類準確率將顯著降低。在篩選預測模型時,應用該方法尋找的輸入向量中,使用MDG(平均基尼指數下降)來評價變量重要性,計算公式如下:

式中:n 為樹個數;err00B 為帶外數據的誤差;t為節點數;p(k/t)為節點t 中目標變量為第k 個的概率。根據式(2)計算每棵樹的GI 值,平均所有樹的結果得到MDG 值。

本文則采用MDG 作為特征重要性指標,對于模型來說該數值越大,則該特征重要性越高;反之則越低。將特征重要性進行倒序排序,再選取排名較高的特征作為特征選擇入模。

2 CPSO-LSSVM 預測算法優化

2.1 LSSVM 算法

使用LSSVM 模型最小二乘線性函數作為損失函數,在特定的非線性映射空間中構造最優決策函數,具體實現如下。

給定集合{(xi,yi),i=1,2,…,m},其中,xi(xi∈Rd)為第i 個訓練樣本的輸入向量;為對應輸出值。在高維特征中建立線性回歸函數:

式中:φ(x)為非線性映射函數;w為權值向量;b為偏置。

利用結構風險最小化原則,選擇損失函數為誤差的二次項,LSSVM 問題可表示為:

式中:C 為懲罰因子;ei為誤差變量;ξ 為松弛變量。式(4)、式(5)引入lagrange 乘子αi,得:

隨后利用最小二乘法求解回歸系數α 和偏置b,從而得到LSSVM 預測函數:

雖然最小二乘法能構造最優決策函數,但是該算法依舊存在2 個超參數C 和g 待優化,C 越大,經驗風險越小,結構風險越大,容易出現過擬合;C 越小,模型復雜度越低,容易出現欠擬合;g 越大,支持向量越少;g 值越小,支持向量越多。因此,需要用CPSO 算法對這2 個參數進行尋優。

2.2 CPSO 參數優化

利用CPSO 優化算法選擇粒子提升種群收斂速度,避免局部最優早熟,提高全局搜索能力[14-15]。

混沌粒子產生在待優化C 和g 的約束范圍內。在訓練集樣本中使用交叉驗證方法訓練LSSVM模型,訓練集的另一部分樣本用于測試模型精度。通過測試交叉驗證誤差得到粒子適應度函數,并使用混沌粒子群搜索參數約束范圍內的最佳粒子,再確定LSSVM 的回歸模型。

CPSO-LSSVM 預測算法優化步驟如下:

(1)將樣本集分為k 個互不相交的子集,每個子集的代銷大致相等。

(2)混沌初始化。利用Logistic 迭代公式得到混沌粒子,將混沌粒子zi的各個分量載波到優化變量的取值范圍。

(3)計算各個粒子的適應度值。

(4)從初始群體中選擇性能較好的解作為初始解,隨機產生初始速度。

(5)更新粒子速度,采用自適應調整的策略,隨著迭代的進行,線性減少w的數值。

(6)產生混沌擾動u1=(u11,u12,u1n),u1j=4(1-u0),j=1,2,…,n,將u1各個分量載波到混沌擾動范圍[-β,β]內,擾動量Δx=(Δx1,Δx2,Δxn),Δxj=-β+2βu1j。

(7)更新粒子位置,更新公式為:

(8)計算第i 個粒子的適應度fi,若粒子的適應度優于原來的最優位置的適應度,設置當前適應度為最優位置的適應度pbestfi,設置當前位置為最優值pBestk。

(9)是否達到最大迭代次數,如果是則繼續步驟(11);反之,重復步驟(8),(9)。

(10)根據各個粒子最優位置的最優值pBestk,從而找出全局最優位置的適應度pBestfk和全局最優位置的位置gBestk。

(11)輸出全局最優位置的適應度和全局最優位置gBestk。

通過上述算法步驟,則可得到最優的LSSVM模型的2 個超參數C 和g,從而得到最優的回歸模型。

3 基于RF-CPSO-LSSVM 的日線損率置信區間預測算法

基于RF-CPSO-LSSVM 的日線損率置信區間預測一共包括7 個流程,分別是數據清洗、數據歸一化、RF 算法特征選擇、CPSO-LSSVM 模型訓練、日線損率預測、設置置信度及置信區間和日線損率區間估計,算法流程如圖1 所示。

圖1 RF-CPSO-LSSVM 日線損率置信區間預測算法流程

3.1 數據預處理

3.1.1 數據清洗

數據清洗包括數據去重、異常值剔除和缺失值填充3 個步驟。數據去重是為了保證樣本的單一性,防止重復樣本造成模型干擾;異常值剔除是為了防止極端數據產生數據傾斜,干擾模型的魯棒性;缺失值填充是為了防止樣本的浪費,因此對缺失值進行填充,以提升模型的泛化能力。

3.1.2 數據歸一化

由于原始數據的各維度之間的量綱不同,未經過預處理的數據直接進入模型會增加模型的擾動性,因此需要對數據進行歸一化處理:

式中:i 為樣本集中第i 個樣本;j 為樣本集中第j個維度;xi,j為歸一化前的第i 個樣本的第j 維數據的數值;xmin,j為歸一化前第j 維數據的最小值;xmax,j為歸一化前第j 維數據的最大值;為歸一化后的第i 個樣本的第j 維數據的數值。

3.2 RF 算法特征選擇

設配電網中有n 個節點,q 個電源點(負荷等效為負電源),節點電壓方程為:

式中:U 為配電網中各節點的電壓;I 為各電源節點的電流;Z為網絡中節點的阻抗矩陣。若配電網支路l 的首末節點為i 和j,線路導納為yij,則支路l 的損耗功率為:

由式(11)可知,線路的損耗與網架的整體拓撲結構和每個電源點的功率有關。因此,綜合節點注入的電能Cs=(c1s,c2s,…,cqs)與拓撲參數特征向量Cl=(cy1,cy2,…,cyl0)共同組成的特征向量為CB=(c1s,c2s,…,cqs,cy1,cy2,…,cyl0)。對于存在數據缺失的情況,建立采集向量A=(a1,a2,…,cn),A為0、1 離散向量,其中0 代表采集失敗;1 代表采集成功。歐氏距離是常用的相似度度量指標,則第i 天和第j 天的距離計算公式為:

式中:Ai和CBi分別為第i 天的采集向量和特征向量;Aj和CBj分別為第j 天的采集向量和特征向量;Aij為第i 天和第j 天的采集向量交集;⊙運算為2 個向量逐個元素相乘,其運算過程為:

利用配電網的拓撲數據和節點注入電能數據共同構成特征向量,并且考慮到采集缺失的情況,構建了采集向量,綜合計算求取2 天特征向量的歐式距離(距離值越小,則表明這2 天配電網的用電行為特征越相近)。

隨后,通過RF 算法對特征的重要性進行倒序排序,并計算特征的累計貢獻率:

式中:n 為特征總數;Pi為前i 個特征的累計貢獻率;ipesttk為第k 個特征的特征重要性數值;為前i 個特征的特征重要性總和;ipesttk為n 個特征的特征重要性總和。

為了保證模型的穩定性和魯棒性,選取累計貢獻率大于95%的特征入模。

3.3 CPSO-LSSVM 回歸模型

設置CPSO 尋優算法的參數,包括迭代次數、種群規模、慣性權重、飛行速度上下限和混沌擾動范圍。

在評價某一參數組[C,g]的LSSVM 模型時,選用RMSE(均方根誤差)作為目標函數,該數值越小,回歸效果越好;反之,則回歸效果越差,即模型越差。RMSE 計算公式為:

式中:yi為第i 個樣本的真實標簽;為第i 個樣本的預測標簽。

通過算法迭代,輸出最佳參數組[CBest,gBest]所對應的模型。

3.4 日線損率置信區間估計

在獲得最佳模型后,對當天所有的臺區進行預測線損率,并設置數據置信度為μ,可以求得置信區間為[σmaxmin,σmaxmax]。置信區間的區域劃分如圖2 所示。

圖2 置信區間的區域劃分

表1 列出了3 個典型置信度下的誤差范圍。

表1 3 個典型置信度下的誤差范圍

由表1 可知,置信度越小,則誤差范圍越小,即預測區間越精確;反之,則預測區間的誤差越大,結果誤差越大。

4 案例分析

當前大部分臺區的拓撲數據缺失,因此無法使用傳統的算法進行理論線損計算,但是負荷數據和檔案數據保存較好,如浙江省某地級市下屬臺區負荷數據的缺失率2.3%、采集成功率99%,理論線損在近一年內皆小于7%。選取現場作業人員人工核查數據質量較好且長期線損穩定的浙江省某地級市162 個臺區進行建模。隨機選取時間尺度為2019 年11 月1 日—2019 年12 月1 日。根據文獻[11]研究得出樣本的特征維度日供電量、日用電量、變壓器總容量、平均負載率、平均電流不平衡度、變壓器的TA 變比和平均功率因數共7 個維度對理論線損影響較大,所以本文也采用這7 個特征維度,將2019 年11 月1 日—2019 年11 月30 日的數據作為訓練集,2019 年12 月共計30 天的數據作為測試集。

4.1 數據預處理

首先,進行數據去重,將原始樣本量從3 316條降為3 100 條;其次,對數據進行歸一化;最后,將2019 年11 月1—30 日的數據作為訓練集,2019 年12 月共計30 天的數據作為預測集。

4.2 RF 算法特征選擇

4.2.1 RF 超參數設置

先設置RF 算法的超參數,具體設置如表2所示。

表2 RF 算法超參數設置

表2 中,n_estimators 為樹的棵樹,設置為100;max_depth 為樹的深度,設置為5;min_sam ple_leaf 為葉子節點所需的最小樣本數,設置為31;criterion 為評價標準,設置為‘gini’。

4.2.2 累計貢獻率曲線

用RF 算法對特征進行篩選,在完成特征重要性的倒序排序后,計算特征的累計貢獻率,并繪制累計貢獻率曲線,如圖3 所示。

圖3 累計貢獻率曲線

由圖3 可知,當使用日供電量、變壓器總容量、日用電量和平均負載率這4 個變量時,累計貢獻率達到90.296 7%,因此本文選擇這4 個變量作為模型的特征。

4.3 CPSO-LSSVM 預測及結果分析

4.3.1 CPSO 優化算法參數設置

設置CPSO 優化算法的主要參數,各參數的具體數值如表3 所示。

表3 CPSO 優化算法主要參數設置

4.3.2 模型效果分析

在經過300 次迭代后,得到最優LSSVM 模型,且懲罰因子C=3.64,懲罰因子g=0.78。

本文選取LSSVM,PSO-LSSVM 和APSOLSSVM 作為對比算法,并且評價指標選取MSE(均方誤差)、RMSE 和MAPE(平均絕對誤差百分比)對本文算法的準確性進行驗證,各算法的預測曲線如圖4 所示。

圖4 各算法預測曲線對比

由圖4 可知,各算法預測結果較為精確,偏差較小。各算法的MSE,RMSE 和MAPE 的結果如表4 所示。

表4 算法效果對比

由表4 可知,本文算法的MSE 為0.052 6,RMSE 為0.066 5,MAPE 為0.124 2;3 項指標皆小于其他3 個算法,因此基于RF-CPSO-LSSVM的日線損率置信區間預測的改進效果明顯。

4.4 理論線損率置信區間估計

繪制置信度在60%~99%之間的理論線損率的置信區間預測,如圖5 所示。

圖5 各置信度下的理論線損率置信區間預測

由圖5 可知,當置信度為99%時,100 個樣本中有97 個處于置信區間內;當置信度為95%時,則有99 個樣本處于置信區間內;當置信度大于90%時,則全部樣本均在置信區間內。因此,在90%的置信度下的模型能夠較好地預測次日理論線損率的置信區間。

5 結語

針對當前臺區拓撲數據不全所造成的傳統理論線損計算方法不適用的現狀,本文采用RF 算法對特征的重要性進行排序,并計算各特征的累計貢獻率對特征進行篩選;利用CPSO 算法對LSSVM 算法的懲罰因子C,g 進行參數尋優以獲得最佳預測模型;選取95%置信度下的理論線損置信區間作為預測結果,為理論線損率的預測提供一種新方法。

猜你喜歡
特征模型
一半模型
抓住特征巧觀察
重要模型『一線三等角』
新型冠狀病毒及其流行病學特征認識
重尾非線性自回歸模型自加權M-估計的漸近分布
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 久久久无码人妻精品无码| 日韩免费成人| 成人国产免费| 中文字幕日韩欧美| 国产精品亚洲va在线观看| 亚洲国产中文在线二区三区免| 欧美在线视频a| 欧美国产日韩在线播放| 欧美亚洲第一页| 丁香婷婷激情网| 亚洲男人的天堂久久香蕉网| 无码精品国产VA在线观看DVD| 久久久久中文字幕精品视频| 国产欧美日韩在线一区| 四虎免费视频网站| 国语少妇高潮| 女人天堂av免费| 亚洲AV无码乱码在线观看裸奔| 国产高清又黄又嫩的免费视频网站| 中文字幕av无码不卡免费| 国产第一页第二页| 亚卅精品无码久久毛片乌克兰 | 一区二区三区国产| 在线观看国产精品一区| 福利片91| 97影院午夜在线观看视频| 亚洲AⅤ综合在线欧美一区| 综合色在线| 无码高潮喷水专区久久| 欧美国产中文| 91免费在线看| 亚洲综合色婷婷| 亚洲免费人成影院| 国产成人精品高清在线| 伊人久热这里只有精品视频99| 在线观看91精品国产剧情免费| 日韩黄色大片免费看| 69av在线| 国产av一码二码三码无码| 久久久久久午夜精品| 香蕉国产精品视频| 亚洲成a人在线观看| 中文字幕无码av专区久久| 亚洲中文字幕无码mv| 二级特黄绝大片免费视频大片| 日韩免费毛片视频| 午夜日本永久乱码免费播放片| 欧美日韩另类在线| 免费一看一级毛片| 超碰免费91| 久久女人网| 精品人妻一区无码视频| 亚洲永久色| 欧美区国产区| 婷婷六月综合网| 亚洲aaa视频| 亚洲无码精品在线播放| 伊人激情久久综合中文字幕| 欧美精品三级在线| 97人人做人人爽香蕉精品| 国产欧美日韩精品综合在线| 国产在线自揄拍揄视频网站| 97影院午夜在线观看视频| 亚洲第一成年人网站| 无码日韩视频| 欧美成人国产| 全色黄大色大片免费久久老太| 亚洲人在线| 伊人婷婷色香五月综合缴缴情| 免费人成又黄又爽的视频网站| 亚洲无码37.| 亚洲熟妇AV日韩熟妇在线| 国产精品网址在线观看你懂的| 国产网友愉拍精品| 国产白浆在线| 亚洲αv毛片| 免费国产高清视频| 67194在线午夜亚洲 | 亚洲人成网线在线播放va| 99久久精品免费看国产电影| 天堂成人av| 美女内射视频WWW网站午夜 |