


摘 要:本文旨在針對智慧電網資產管理狀態評估,利用誤差反向傳播神經網絡構建狀態預警分析機制,并通過性能測試探討神經元數量與網絡結構對預警準確率的影響,以期為數字化資產管理提供有效支持。通過試驗結果發現,在不同隱藏層數和樣本規模下神經網絡模型存在相應變化,在較小樣本規模和較少隱藏層數條件下,增加神經元數量可以降低誤差率;而在較大樣本規模和隱藏層數條件下,可能導致過擬合效應。這一結果說明在智慧電網資產管理狀態評估中需要謹慎考慮選擇合適大小及結構深度,以獲取最佳預測精度。
關鍵詞:大數據;資產管理;狀態預警;多層前饋算法
中圖分類號:F 407 文獻標志碼:A
對企業和組織來說,如何有效地評估資產狀態并提供及時、準確的預警信息至關重要,本文面向大數據的計量資產管理分析,運用誤差反向傳播神經網絡構建狀態預警分析機制,此方面已有一定規模先行研究提供參考與支持。黃璐等[1]探索與實踐基于數智技術的新商科試驗數據資產管理體系,推動數字教育生態發展。徐京平等[2]構建國家審計與公共數據資產管理邏輯體系,提出驅動路徑,以促進我國數字治理現代化。孫圣雄等[3]研究了技術與信任融合的數字藝術產業數據資產管理體系,促進數字藝術健康發展并保護主體權利。侯修群等[4]通過DPMM方法解決核主泵狀態預警問題,并開發振動異常數據定位方法提高預警準確率。王曉蓉[5]提出基于大數據挖掘的電力變壓器健康狀態差異預警規則策略,并成功應用于現場運行中,準確率為98.21%。徐堯宇等[6]引入信息決策理論和屬性依賴度理論解決信息缺失下變壓器狀態預警問題,驗證其有效性,為變壓器智能化運維和風險管控提供了指導。馬新娜等[7]提出了高速列車監測大數據可視化分析模型。
1 模型構建
1.1 數據獲取
在針對智慧電網資產管理狀態評估的研究中,數據的準備階段至關重要。智慧電網涉及大量復雜的資產,例如變壓器、電表、傳感器等,這些資產產生的數據對分析和預測電網運行狀態至關重要。面向預警需要,收集與智慧電網相關的大規模結構化和非結構化數據,包括實時負荷情況、設備運行狀態、天氣條件等信息。在數據準備階段,需要收集各種相關的數據源,例如電壓 V(t)、電流I(t) 、溫度 T(t)等各種傳感器測量的實時數據。這些數據在時間上可能是連續的或者不連續的。為了進行模型處理和分析,需要為所有的連續或不連續時間流中的數據分配時間戳t ,以確保數據的時序性和連續性。
設ti為第i個時間點,構成事件流 t1,t2,…,tn,其中n為數據點的總數,也即采樣的總體時間跨度。每個時間點ti對應1組測量數據,例如電壓V(ti) 、電流I(ti) 、溫度 T(ti)以及與之相關的其他信息。
立足這一時間流,模型還需要基于時間戳增加設備的維修歷史、維護時間、更換部件等信息,以捕捉系統環境的故障和異常。為了考慮長期穩定的外部環境變化,模型也需要收集例如天氣條件、季節變化等可能影響電網運行的外部因素,為時間戳增加其周期性波動材料,從而更好地處理電網資產管理的各類環境時間因素,豐富其時間戳信息,為后續分析奠定良好基礎。
為了兼顧多樣化的數據支持,其數據收集與整合工作復雜,這些數據來源于不同的系統和平臺,需要通過API、數據庫查詢或直接采集來獲取,通過電網內部信息渠道進行采集,包括設備中的環境監測傳感器與業務活動通信流進行數據捕捉、分類,并存儲在數據庫中。確保數據的完整性、實時性和準確性是數據準備階段的首要任務,因為后續的分析和預測結果直接依賴這些數據。
1.2 數據整理
基于復雜的數據來源整理、歸集,其還需要進行下一步數據清洗和特征工程的處理以及數據的有效劃分,確保在建模和評估過程中能夠充分利用數據的潛力。一旦數據收集完成,接下來是數據清洗和特征工程的處理。數據清洗旨在處理數據中的錯誤值、缺失值和異常值,以確保數據質量和一致性。其需要將不同尺度和單位的數據轉換為統一的標準,以便模型在訓練過程中能夠更好地收斂和表現。基于此,需要利用特征工程技術從原始數據中提取關鍵特征,例如負荷曲線形狀、設備溫度變化趨勢等。同時,也需要識別并處理與正常數據分布不一致的異常值,可以通過統計方法或機器學習算法來實現。這些特征將成為神經網絡訓練和預測過程中使用的輸入,其輸入樣本如公式(1)所示。
X={p1,p2,…,pn} (1)
式中:X為輸入樣本;p1,p2,…,pn為傳感器或其他來源數據的時間序列。
確定適當類型和層數的模型與算法,并設置每個隱藏層節點數以及輸出層節點數來適應所需任務。具體來說,本文相應選擇泛化性能良好的多層前饋算法,其在圖像處理、語音識別、自然語言處理、金融風控、醫療影像輔助等許多領域都有成功案例,相關系統均運作良好。在智能電網資產管理中,可以使用神經網絡等機器學習模型來構建狀態評估模型,假設的神經網絡包括L層,l包括權重矩陣W(l)、偏置向量b(l)以及激活函數σ()。在前向傳播過程中,輸入樣本X在權重矩陣W(l)和偏置項b(l)的作用下,通過激活函數σ(),逐層計算得到輸出結果Y,其過程如公式(2)所示。
z(l)=W(l)a(l-1)+b(l) (2)
式中:l為神經網絡中的每一層,從輸入層開始遞增直到輸出層,其中輸入層為1,輸出層為L;W(l)為第l層與第l+1層之間連接權重矩陣,它用來調整不同層之間節點(或者稱為神經元)之間傳遞信息時所使用的權重;b(l)為偏置向量,在計算每個節點激活函數前都會加上一個偏置項;a(l+1)為對上一層的繼承,又涉及激活函數的參與。
1.3 參數調整
由此,這個輸出也會成為下一層節點的輸入信號,其逐層遞進中的a(l)如公式(3)所示。
a(l)=σ(z(l)) (3)
式中:σ()為激活函數,在每個節點上引入非線性特性并捕獲更復雜的模式和關系,通常包括Sigmoid、ReLU、tanh等函數。
因此,針對輸入層有公式(4)。
z(1)=σ(W(1)X(1)+b(1)) (4)
針對輸出層有公式(5)。
Y=σ(W(L)a(L)+b(L)) (5)
神經網絡訓練中,損失函數的計算和反向傳播算法的應用都是為了優化模型的性能,以更好地預測電網資產的狀態和性能。通過訓練神經網絡,可以建立一個復雜的數學模型,用于狀態評估系統的開發。這個模型可以利用歷史數據和實時數據來預測電網資產的狀態和性能,并提供預警機制,以便及時采取措施來維護電網的運行和穩定性。
當訓練神經網絡時,需要計算損失函數來衡量模型預測值與真實標簽之間的差異,損失函數的計算和反向傳播算法的應用都是為了優化模型的性能,以更好地預測電網資產的狀態和性能。通過訓練神經網絡和比較差異,可以評估模型在當前參數下的表現,利用歷史數據和實時數據來預測電網資產的狀態和性能,并提供預警機制,以便及時采取措施來保證電網的運行和穩定性,并利用這一信息來調整參數,以減少損失函數,使模型更好地擬合訓練數據。
其損失計算如公式(6)所示。
(6)
式中:L為損失函數(Loss);Y為神經網絡輸出的預測值;Yture為真實標簽。
反向傳播算法用于計算損失函數對網絡參數的梯度,進而更新網絡參數,以最小化損失函數。反向傳播主要分為2個部分,包括求解各參數對應導數和利用這些導數來更新相應參數(使整體損失減小)。基于此,匯聚從最后一層開始逐漸往回更新,需要根據當前預測與真實目標之間誤差量L,計算最后一次迭代產生錯誤所影響到每個節點上面需要調整多少才能減小總體誤差。接著根據鏈式法則、矩陣轉置等原理依次推斷其他隱藏、隱含結點所需調整量,利用這些參數來更新相應參數,使整體損失減小,最終使用如下方式來完成模型內部變量修正。
其中,更新連接權重矩陣如公式(7)所示。
(7)
式中:α為學習率,這一超參數用于控制步長大小,從而影響單次迭代的波動水平。
更新偏置項如公式(8)所示。
(8)
以上兩者構成一個不斷交替迭代優化的過程,直至達到許可精度或者盡可能接近全局最佳狀態,包括對各種資產狀態和性能的實時監測和預測以及對潛在問題的及時發現和解決。
2 性能測試
本研究中,利用智慧電網數據庫獲取了大規模數據集。這些數據包括了各種計量資產的運行狀態、能源消耗情況以及設備健康狀況等信息。在獲得原始數據后,去除重復記錄、缺失值以及異常值,并對噪聲進行平滑處理,提取與資產管理狀態評估相關的特征變量,并對其進行歸一化處理。基于不同隱藏層數和樣本規模要求,在經過清洗和提取后,按照設定條件隨機抽取相應數量的樣本作為訓練集和測試集。基于此數據集展開多輪測試試驗,以評估不同隱藏層數下神經網絡模型在計算耗時及預警準確率水平上的表現。
2.1 計算耗時分析
針對不同隱藏層數和樣本規模,隨著神經元數量增加,計算耗時也隨之上升。針對不同水平隱藏層數,不同樣本規模條件下其計算耗時隨神經元數量增長而迅速增長,在100神經元水平下略高于300s。當隱藏層數增多時,這一消耗時間會出現波動幅度逐漸擴大的趨勢。盡管如此,在神經元數量較少且合理控制范圍內仍能有效地控制計算時間。這一結果表明了隱藏層數量對計算效率具有重要影響,增加隱藏層可以提高預測準確度,但可能導致更長的訓練時間;同時,需要注意在選擇合適范圍內調節神經元數量,以平衡預測準確度和運行效率之間的關系。在相同隱藏層數和樣本規模條件下,在神經元數量變化下獲得計算時間曲線如圖1所示。
2.2 預警準確率分析
當對不同隱藏層和樣本規模的數據集進行分析時,著重關注了預警準確率。根據研究結果顯示,誤差率與神經元數量呈負相關:隨著神經元數量增加,誤差率呈下降的趨勢。特別是在較小樣本規模和較少隱藏層數條件下,表現出相對較低的誤差率水平(隨著神經元數量上升從13%降至4%)。總體來說,在整個試驗范圍內,總體誤差率從15%逐步降至略高于3%的水平。在較大樣本規模和隱藏層數條件下,觀察到一個截然相反的情況:隨著神經元數量上升,這些情況存在更低的錯誤估計水平(誤差率由14%降至2%)。這一結果顯示,當復雜度稍微簡單一些、訓練數據量不太大時,增加網絡容量可以顯著地改善預測準確性。然而當處理更復雜、更龐大的數據集時,增加網絡容量會產生類似“過擬合”效應,并導致訓練集上表現良好但測試集上泛化能力欠缺。因此,在智慧電網資產管理狀態評估中需要謹慎考慮選擇合適大小及結構深度,以獲取最佳預測精度。
3 結語
在面向預警需求的基礎上收集與智慧電網相關的大規模結構化和非結構化數據,并利用特征工程技術從原始數據中提取關鍵特征。選擇泛化性能良好的多層前饋算法作為主要算法架構,并詳細介紹了其涉及的計算過程、激活函數以及損失函數選擇。針對性能測試方面,獲取并處理了來自智慧電網數據庫中包括各種計量資產運行狀態、能源消耗情況以及設備健康狀況等信息的大規模數據集。通過試驗結果發現,在不同隱藏層數和樣本規模下神經網絡模型表現出相應變化:隨著神經元數量增加而導致錯誤率呈下降的趨勢;同時,也觀察到較小樣本規模和較少隱藏層數條件下顯示出較低誤差率水平,在較大樣本規模和隱藏層數條件下則會呈現更低的錯誤估計水平。這一發現提示需要選擇適當大小及結構深度,以獲得最佳預測精度。因此,當進行智慧電網資產管理狀態評估時,需要謹慎考慮這些因素之間的關系。
參考文獻
[1]黃璐,周勇義,邢姝,等.基于數智技術的新商科實驗數據資產管理體系探索與實踐[J].實驗室研究與探索,2024,43(4):184-189.
[2]徐京平,張可雨.國家審計與公共數據資產管理:邏輯體系、作用機制和驅動路徑[J].財會通訊,2024(5):14-21,26.
[3]孫圣雄,殷俊.技術與信任融合的數字藝術產業數據資產管理體系研究[J].情報科學,2023,41(4):99-104,116.
[4]侯修群,蔣慶磊,李振,等.基于DPMM的核主泵振動狀態預警方法研究[J].原子能科學技術,2021,55(增刊2):342-349.
[5]王曉蓉.基于大數據挖掘的電力變壓器健康狀態差異預警規則策略[J].電測與儀表,2024,61(2):216-224.
[6]徐堯宇,李元,王怡靜,等.信息缺失下變壓器狀態預警方法[J].高電壓技術,2020,46(9):3062-3069.
[7]馬新娜,施文銳.高速列車狀態監測大數據的預警可視化分析研究[J].電子測量與儀器學報,2019,33(7):21-27.