999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于空間相似度和深度學習的中長期用電量預測

2021-06-03 02:45:48章劍光劉理峰林海峰張永建
浙江電力 2021年5期
關鍵詞:用戶方法

章劍光,劉理峰,林海峰,張永建

(國網浙江省電力有限公司紹興供電公司,浙江 紹興 312000)

0 引言

提升用電量預測的精度一直是智能電網建設的熱點研究方向。同時,準確的用電量預測對電網規劃和經濟部門的管理決策具有重要的指導意義[1]。電力公司收集了大量的用戶用電數據,從數據分布的角度,這些數據呈現規律復雜、峰谷特征多樣化等特點。無論是負荷數據還是用電量數據,對數據進行合理聚類,歸納同類型數據的統一特征,對其進行特性分析是必要的。良好的特性分析不僅可以提高預測的準確性,還可以提高預測的效率[2]。因此,用戶類別聚類往往是用電量預測的必要前序環節。

我國根據電價類型和負荷特性將電力用戶劃分為居民用戶、商業用戶、工業用戶、非工業用戶和其他用戶共5 類。目前,在電量預測工作中,各類用戶用電需求發展規律存在較大差異。用電數據與用電預測效果之間存在兩大矛盾:一是追求數據的擬合精度可能會降低預測方法的泛化性;二是過于追求復雜算法,會由于數據需求量太大而降低可操作性。因此,需要從新的思路出發,采用新的方法進行中長期用電量預測。

相關文獻開展了關于用戶分類的研究。傳統的聚類方法針對電力用戶側數據,在選取特征和權值的基礎上,采用聚類方法對樣本進行相似性搜索[3]。文獻[4-5]分別使用了K-means 聚類、KMedoids 聚類進行數據劃分,還有類似于文獻[6]使用的DBSCAN 等基于數據密度的劃分方法。另外,文獻[7]引入GMM(混合高斯模型)對用電量計量數據聚類,從而劃分用戶類別。上述分類方法側重于根據用電數據的數值分布來確定聚類簇,卻相對欠缺對用電曲線形狀相似性的分析,而形狀相似性是區分用戶類別的潛在重要指標。

另外,關于用電量預測方面的研究,本質上和負荷預測任務相似,是時間序列的回歸問題。針對提升時間序列預測精度的問題已有一定的研究。傳統的研究方法,如文獻[8]和文獻[9],分別使用了自回歸滑動平均模型和自回歸積分滑動模型實現時間序列數據的預測。目前的研究方法中,研究人員將機器學習、深度學習技術應用于預測任務,文獻[10]提出了一種遞歸笛卡爾遺傳規則進化人工神經網絡用于峰值負荷預測,模型可以預測一年中各個季節的不同負荷模式;文獻[11]提出了LSTM(長短時記憶神經網絡)來解決傳統RNN(循環神經網絡)丟失歷史數據信息的問題,通過評價指標,已經證明對時間序列數據,深度學習方法比傳統方法具備更好的預測效果。

本文以提升各行業用電量預測的精度作為研究目標,提出了一種先聚類、后預測的方法。利用DTW(動態時間規整)距離作為定量指標來區分每條用電曲線類別;利用層次聚類方法在聚類后建立各行業的獨立用電量數據集,使每個獨立數據集內的用電曲線具備相似的變化規律。最后,通過深度循環神經網絡,分別建立LSTM 和GRU(門控循環單元)深度網絡模型針對各個行業建立單獨的用電量預測模型,并利用MSE(均方誤差)作為定量評價預測效果的指標。

1 基于動態時間規整的用戶聚類

合理、準確地區分用電用戶的類別對分析各行業用電特征具有重要意義,也是提升后續預測任務精度的基礎。本文為了提升后續用電量預測的精度,首先使用DTW 距離和層次聚類法對用戶進行聚類。使用DTW 距離作為定量評價用電曲線相似性的依據,根據該距離使用層次聚類法求取每條用電曲線所屬的類別,并建立對應類別的數據集,作為后續訓練深度預測網絡的訓練集。

用戶的用電量數據隨時序不斷地采集、記錄,以本文面向的數據對象為例,每條用電曲線代表一個單獨的用戶,曲線的每個數值點表示當日的用電量,如圖1 所示。

圖1 某用戶用電量數據分布示例

1.1 動態時間規整方法理論及其必要性

動態時間規整是時間序列的聚類方法之一。常用的時間序列聚類方法及其對應的相似度評價指標如表1 所示。該方法主要是基于動態時間規整來度量時間序列之間的相似度或者距離,然后將時間序列數據劃分為不同組,同一組中的時間序列在空間形狀上是相似的。本文使用DTW 距離作為區分各用電曲線類別的原因是,欲將具有相似形狀的曲線劃分到一起,使得單個數據集內的數據具備明顯的空間相似性,以便于學習器更好地學習組內數據特征,進而提升用電量預測的準確性。

表1 時間序列數據聚類方法及其指標

DTW 距離適用于衡量兩個時間序列在總體上相似、而在X 軸上局部特征并不匹配的情況。若采用傳統的基于歐式距離的聚類方法,則有可能得出不準確的聚類結果,如圖2 所示。

圖2 采用歐式距離的聚類示意圖

圖2 中,展示了兩條用戶年用電量曲線,使用K-means 算法處理原始數據后,結果表明兩個用戶屬于同一類別。雖然兩條曲線的取值范圍相似,基于歐式距離的算法據此得出了兩個用戶用電量規律相同的結論,然而從曲線中可看出兩個用戶在局部用電行為上存在極大的不同,將他們歸類為同一類別是不合理的,將影響后續的用電預測效果。因此,應該發掘使用新方法克服傳統方法分類用戶不準確的問題,基于DTW 距離并結合層次分析法是解決該問題的有效方案。

相較于傳統的基于歐式距離的方法,DTW通過局部拉伸或壓縮兩個時間序列以使其盡可能地相似,然后匯總每一個對齊元素的距離,從而得到兩個時間序列的相似性。DTW 較好地解決了歐氏距離無法處理對應數據間沿時間軸方向伸縮、彎曲和線性飄移的問題[12]。DTW 距離計算過程的數學描述如下。

以兩個時間序列比較為例,設X=(x1,x2,…,xn),Y=(y1,y2,…,ym),定義非負函數f(x)為每一對元素xi和yi局部相異性測度函數如式(1)所示[13],并進一步定義彎曲曲線如式(2)所示:

式中:Φx(k)和Φy(k)分別映射X 和Y 的時間指數,并且Φx(k)∈{1,…,t},Φy(k)∈{1,…,t},其中,k=1,…,T。

對于給定Φ,計算彎曲時間序列X 和Y 的平均累積變形:

式中:mΦ(k)為權重系數;MΦ為對應的歸一化常數,有Φx(k)≤Φx(k+1)。

DTW 通過X 和Y 的求解組合,尋求多個曲線的最優對齊彎曲路徑,即:

基于上述理論,通過DTW 來表征不同用戶用電量曲線的相似性,定量地反映了用戶之間的用電規律相似程度,為后續的聚類環節提供最主要的依據。

1.2 層次聚類方法理論

層次聚類法是一種通過計算不同類別數據之間相似度而創建的具有層次結構的嵌套聚類樹。

如本文1.1 節所述,將DTW 距離作為定量計算不同用戶用電規律相似性的依據,而后將該相似度由高到低進行排序,逐步連接各個點形成層次聚類樹。層次聚類法在本文所提出整體方案中的一般流程為:

(1)移除網絡中的所有邊,得到有n 個孤立節點的初始狀態,n 個孤立節點是n 個用戶的年用電量數據。

(2)計算網絡中每對節點彼此的相似度,即計算各條用電曲線之間的DTW 距離。

(3)根據相似度從強到弱連接相應節點對,形成樹狀圖。

(4)按照相似度的大小橫切樹狀圖,使得每個簇中的曲線具備形狀相似性。

在獲取層次聚類樹狀圖后,將樹枝上每一個樹分支作為一個分類單位;然后,將每個類別的數據單獨作為一個數據集,對每個類別中的全部數據在相同的時間步上進行求和,為后續預測模型提供具備相似形狀規律的訓練集。

2 深度學習模型

RNN 通過將信息從網絡的上一層傳輸到下一層,使得網絡隱含層每個時刻的輸出都依賴于以往時刻的信息,從而使得網絡整體具備信息保持能力,較好地適用于數據回歸任務。

2.1 數據離差標準化

數據標準化對提升模型收斂速度和提升模型精度具有重要意義。由于原始數據的數值分布區域廣,導致訓練網絡時的損失較大,無法得出有效的結果,因此,通過標準化方法將數值壓縮至區間[0,1]中。

常用的數值標準化方法包括離差數據標準化(Min-Max 標準化)、log 函數轉換和Z-score 標準化等等。在原始數據確定的情況下,數據集的最大、最小值已經確定,因此本文使用Min-Max 標準化方法對原始數據的數值范圍進行約束。

對序列x1,x2,…,xn進行Min-Max 標準化的數學描述如式(5)所示:

式中:y1,y2,…,yn是產生的無量綱新序列,其數值區間為[0,1]。

2.2 長短時記憶神經網絡

LSTM 是RNN 的一種擴展,專門設計用來避免長期依賴問題。與樸素RNN 不同,LSTM 存在4 個以特殊方式相互影響的神經網絡層,網絡模塊示意如圖3 所示。在LSTM 中,通過門結構來對增加或刪除信息,而門結構是選擇性地讓信息通過的方式,通常由一個Sigmoid 神經網絡層和逐點乘積操作組成。

圖3 LSTM 核心結構

LSTM 網絡具有輸入門、遺忘門、輸出門3種門結構,用以保持和更新信息流狀態。按照信息進入網絡的順序,依次是遺忘門、輸入門和輸出門,第一階段是遺忘門,從信息流中提出了部分信息;下一階段是輸入門,輸入門確定新信息是否可被存放到細胞狀態中;最后一個階段是輸出門,輸出門確定輸出值。LSTM 是以3 個門結構組成的單元,3 個門結構的數學描述如下:

(1)遺忘門。遺忘門以上一層的輸出ht-1和本層要輸入的序列數據xt作為輸入,σ 代表激活函數sigmoid,w 和b 分別代表待求的權重矩陣和偏置項(以下同),得到輸出ft。ft取值范圍為[0,1]區間,表示的是上一層細胞狀態被遺忘的概率,即邊界值0 指的是完全舍棄,邊界值1 指的是完全保留。

(2)輸入門。輸入門包含兩部分,第一部分使用sigmoid 激活函數輸出為it,第二部分使用tanh激活函數,輸出為

式中:WC為輸入門的權重參數。

(3)輸出門。輸出門用來控制該層的細胞狀態有多少被過濾。首先使用sigmoid 激活函數得到一個[0,1]區間取值的ot,接著將細胞狀態Ct通過tanh 激活函數處理后與ot相乘,即是本層的輸出ht。

式中:W0為輸出門的權重參數。

LSTM 模型解決了信息持久性的問題,因此更好地利用歷史時間序列,獲取高準確率的預測結果。

2.3 GRU 神經網絡

GRU 是RNN 的一種,與LSTM 一樣,其目標也是解決長期記憶依賴和反向傳播中的梯度消失等問題。傳統的GRU 分類模型是一種基于LSTM的模型變體,從網絡結構角度而言,它在LSTM的基礎上將遺忘門和輸入門合并成更新門,使得最終的模型比標準的LSTM 模型更簡單,即實現了以更少參數量實現相同甚至更高準確率的數據預測結果。

GRU 的輸入輸出結構與普通的RNN 相同。有一個當前的輸入xt,和上一個節點傳遞下來的隱狀態ht-1,這個狀態包含了之前節點的相關信息。結合xt和ht-1,GRU 會得到當前隱藏節點的輸出和傳遞給下一個節點的隱狀態ht。GRU 的網絡結構模型如圖4 所示。

圖4 GRU 核心結構

GRU 的內部計算過程,首先通過上一個傳輸下來的狀態ht-1和當前節點xt的輸入來獲取2個門控狀態。其數學理論如下所示:

式中:rt為控制重置的門控;zt為控制更新的門控;Wr,wz分別為對應層的可訓練權重參數。

得到門控信號之后,使用重置門控來得到重置之后的數據,將前向狀態ht-1與控制門控rt相乘,并與輸入xt進行拼接,通過一個tanh 激活函數將數據放縮到[-1,1]的范圍內,得到式(13)。

式中:wh為本層的權重參數;ht主要包含當前輸入xt的數據,將ht添加到當前的隱藏狀態,相當于記憶了當前的狀態。

在這個階段,同時進行了遺忘和記憶兩個步驟。同時,需使用先前得到的更新門控zt,門控信號zt的范圍為[0,1],該信號越接近1,代表記憶下來的數據越多;而越接近0 則代表遺忘的越多。由此可得當前狀態ht更新計算公式,如式(14)所示:

GRU 的優點在于可以使用同一個門控zt同時進行遺忘和選擇記憶,相比之下,LSTM 則需要使用多個門控。GRU 的結構大大簡化了訓練過程中的復雜程度,實現訓練過程的簡單化、快速化。

3 實例分析

本仿真實例通過某地區2019 年200 位用戶的年用電量數據,實現基于DTW 距離的用戶類別劃分、基于深度循環網絡的單類用戶月用電量預測。仿真實例所使用的編程語言為Python 3.6,使用的深度學習架構為Tensorflow。

3.1 用戶聚類實例

如圖5 所示,圖中左上方是計算得到的DTW 距離值,X,Y 軸方向上是2 個用戶的用電量曲線,圖中橫、縱坐標分別表示2 條用電曲線對應的日期天數。圖中坐標軸內的彎曲線段,代表最優對齊彎曲路徑,該線段越趨近于直線表示2 條用電量曲線具備越高的形狀相似性。

圖5 最優對齊彎曲路徑圖

然后,根據層次聚類法理論,計算數據集中所有曲線相互之間的DTW 距離并將其作為區分所有曲線類別的依據。繪制層次聚類樹如圖6 所示。為了更直觀清晰地展示聚類效果,圖中僅展示了隨機選擇的20 個用戶的層次聚類樹,該聚類樹可看作反映全體數據集的局部信息圖??煽闯鼍垲悩渲忻總€小分支中的用電量曲線具備較強的形狀相似性,曲線之間的數字代表鄰近用電量曲線的DTW 距離。

為了直觀地對比DTW 聚類與傳統聚類方法的效果,并使得橫向對比更具代表性,統一了不同算法的聚類數目。以圖6 展示的層次聚類樹為例,以該圖從上到下為序,編號0 至13 一簇為同一類別;編號2 至9 為同一類別;編號1 至8為同一類別。

另外,本實例分別復現了部分相關文獻所使用的K-means 算法、GMM 算法,對全體用戶進行了聚類以作對比。為了更清晰地展示聚類結果,圖7、圖8 分別展示了利用K-means 和GMM對圖6 中20 個用戶聚類的可視化結果。

圖6 基于DTW 的部分用戶層次聚類樹

如圖7、圖8 所示,使用叉形、正方形和圓形圖例分別代表3 類用戶。傳統的K-means 和GMM 等基于歐式距離的方法主要根據用電量數值大小來進行聚類,在圖中可發現該類算法僅按照數值大小區分3 類用戶。GMM 由于在Gaussian數值基礎上引入了概率分布,一定程度上緩解了該問題,但空間相似特性仍未得到充分表征。為進一步驗證本文所提聚類方法的效果,后續通過對比2 種聚類方法并結合深度網絡的預測結果來反映總體性能的優劣。

圖7 基于K-means 算法的部分用戶聚類結果

圖8 基于混合高斯模型的部分用戶聚類結果

3.2 各類用戶用電量預測

針對已獲得的各類用戶的獨立數據集,建立每類用戶單獨的預測模型。訓練網絡時,訓練集和測試集的比例為9:1,即使用十一個月的用電量數據訓練網絡,最后一個月的用電量數據與預測結果進行對比。本仿真實例分別使用K-means,GMM 和DTW聚類的結果,輸入使用LSTM 和GRU 構建的用電量預測模型,通過實驗的預測結果驗證聚類算法的效果。

訓練LSTM 和GRU 網絡時均使用Adam 作為優化器,固定使用2 個LSTM 或GRU 串聯,隱藏層層數設為10 層。結合多次實驗的超參數設置經驗值,對某一類別多次實驗求取平均結果。使用MSE(均方根誤差)作為預測效果的評價指標,該數值越小代表預測效果越好。使用LSTM作為預測網絡的實驗結果,如表2 所示。

表2 基于LSTM 預測器的實驗結果

由表2 可知,總體趨勢上看,采用DTW 作為用戶聚類方法,相比較于傳統的K-means 算法在LSTM 網絡上對中長期用電量具有更好的預測能力。為了對比LSTM 神經網絡的預測效果,還利用GRU 網絡進行了進一步驗證,結果如表3 所示。

通過表2、表3 的綜合比較發現,相較于傳統的數值聚類方法,使用基于空間相似度的DTW方法對用戶聚類后,再結合深度網絡進行預測效果更好。另外,GRU 的預測效果略優于LSTM?;诖?,展示每個類別GRU 網絡的預測結果,如圖9 所示。

表3 基于GRU 預測器的實驗結果

圖9 中,橫軸為時間序列,縱軸為標準化后的用電量,為無量綱數值(以下同)。為證明本文所提方法針對同一類別的不同用戶依然具備良好的效果,進一步預測了用戶類別中某獨立用戶的用電量,預測結果對比如表4 所示,獨立用戶的預測可視化結果如圖10 所示。

圖9 3 類用戶用電量GRU 預測結果

表4 獨立用戶實驗結果

圖10 獨立用戶GRU 預測結果

總體而言,無論是某一類用戶,還是某類用戶中的個體用戶,經過DTW 距離聚類后的預測結果,從曲線形狀上看和原始數據高度相似,亦證明了本文所提出的基于空間相似度聚類的用電量預測方法具有較好的效果。

4 結語

本文以用電用戶類別聚類及數據回歸為核心,提出了提升中長期用電量預測精度的方法。通過DTW 距離定義了不同用戶用電量曲線的形狀相似性,利用層次聚類法根據DTW 距離繪制了層次聚類樹求取用戶類別。然后,根據分類結果,將數據集訓練對應的LSTM 和GRU 深度網絡模型,建立了中長期用電量預測。對比實驗結果表明:采用DTW 形狀相似度聚類后的用戶類別劃分準確,有利于進一步的數據回歸研究;在實驗條件相同的情況下,GRU 深度網絡比LSTM深度網絡具備更好的數據預測效果,適用于回歸任務。

該研究為基于用戶用電行為的類別劃分提出了新的研究思路,通過實驗證明了基于空間相似度指標的用戶類別劃分是有效的,深度循環神經網絡GRU 具備良好的數據預測性能。

猜你喜歡
用戶方法
學習方法
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
主站蜘蛛池模板: 欧美精品xx| 欧美综合区自拍亚洲综合天堂| 欧美日韩一区二区三| 91亚瑟视频| 91无码网站| 久久亚洲中文字幕精品一区| 99在线免费播放| 无码不卡的中文字幕视频| 国产精品私拍99pans大尺度| 亚洲综合在线最大成人| 国产一级在线观看www色| a在线亚洲男人的天堂试看| 国产一级视频久久| 国产精品久久久久无码网站| 91久久精品国产| 91成人在线免费观看| 日韩不卡免费视频| 国产视频一二三区| 亚洲人成影视在线观看| 欧美国产在线看| 55夜色66夜色国产精品视频| 欧美国产精品不卡在线观看| 精品人妻一区二区三区蜜桃AⅤ| 特级毛片免费视频| 国产精品久久久久久久伊一| 91精品免费久久久| 成人在线视频一区| 亚洲色图欧美视频| 国内精品久久久久久久久久影视| 精品国产成人av免费| 国产在线视频福利资源站| 欧美日韩中文国产va另类| 国产人碰人摸人爱免费视频| 欧美日韩第二页| 久久国产黑丝袜视频| 重口调教一区二区视频| 啦啦啦网站在线观看a毛片| 国产免费羞羞视频| 欧美色图久久| yjizz视频最新网站在线| 国产毛片不卡| av在线人妻熟妇| 亚洲第一区欧美国产综合| 欧美日韩动态图| 免费人成在线观看视频色| 欧美日韩在线成人| 国产成人高清精品免费| 极品av一区二区| 日本在线国产| 日韩欧美国产成人| 亚洲天堂网在线播放| 五月婷婷导航| 丁香六月激情综合| …亚洲 欧洲 另类 春色| 亚洲一区无码在线| 久久天天躁狠狠躁夜夜躁| 中文字幕亚洲综久久2021| 久久婷婷人人澡人人爱91| 免费一级无码在线网站| 亚洲福利网址| 精品乱码久久久久久久| 人妻一区二区三区无码精品一区| 中文字幕中文字字幕码一二区| 欧美国产日韩一区二区三区精品影视| 无码高潮喷水在线观看| 亚洲男人在线| 亚洲国产综合精品一区| 国产午夜不卡| 91免费精品国偷自产在线在线| 一级在线毛片| 91色在线观看| 国产成人久视频免费| 老熟妇喷水一区二区三区| yjizz视频最新网站在线| 欧美精品啪啪| 毛片免费试看| 国产精品漂亮美女在线观看| www.亚洲一区| 啊嗯不日本网站| 国产成人欧美| 女同久久精品国产99国| 成年A级毛片|