摘 要:本文基于神經架構搜索技術,利用大規模智能電表數據進行訓練,自動判斷電流、電壓和功率特征,旨在提高竊電行為的準確識別度并降低誤報率。本文采用神經架構搜索算法構建的竊電識別模型,更精準地識別竊電行為。研究的最終目標在于加強供電公司對竊電行為的監測,提高打擊能力,保障電網安全、穩定地運行。該方法的應用十分廣泛,可推動智能電表技術的發展,為電力行業提供更高效的管理手段。
關鍵詞:神經架構搜索;智能電表;竊電行為
中圖分類號:TM 73 " " " " " " " " 文獻標志碼:A
傳統的竊電識別方法主要是人工檢測與統計分析,存在識別準確性低、易受人為因素影響等問題。為了提高竊電行為的識別效果,研究人員開始應用機器學習和深度學習技術。其中,基于神經架構搜索的智能電表竊電識別方法成為研究的熱點。
1 問題闡述
本文的主要目標是利用智能電表采集電力用戶的真實用電量數據,通過分析數據缺失信息,對竊電行為檢測模型進行優化與改良。為實現該目標,本文引入神經架構搜索算法。該算法能夠自動定義用電特征并計算竊電嫌疑度,從而將用戶分為高或低竊電嫌疑度組別。該算法通過測算用戶的竊電嫌疑度,判斷該用戶是否存在竊電行為。本文設竊電懷疑度為P。當P≥0.5時,表示該用戶竊電懷疑度高,其發生竊電行為的概率較大;當Plt;0.5時,表示該用戶竊電懷疑度低,通常情況下不存在竊電行為[1]。本文調取中國國家電網中的公開數據,總結了42373個用戶在1036天內的用電數據,并通過試驗分析,論證了基于該算法構建的切點識別模型的有效性。
2 數據輸入
本文將收集的數據轉化為m×n數據矩陣,其中n表示用戶數量,m表示時間節點數據,如公式(1)所示。
(1)
式中:Xn為第n個用戶的用電量數據序列。
本文中,n=42373,m=1029。考慮計算的簡便性,剔除最后7天的數據,以便將數據轉化為矩陣。在此基礎上,利用卷積神經網絡,將矩陣X轉變為數據張量,即X'(42373×147×7),最終得到Xi'(147×7)。將數列設定為7列,對應一周7天的用電周期,以便進行對比,如公式(2)所示。
(2)
3 基于神經架構搜索的竊電識別方法
隨著人工智能技術快速發展,作為深度學習中的一個新興領域,神經架構搜索被廣泛應用于眾多場景。竊電識別是電力系統中的關鍵問題,本文引入神經框架搜索對其進行優化,旨在提高檢測精確度和效率。
3.1 基于貝葉斯優化的神經架構搜索方法
在竊電識別的應用中,基于貝葉斯優化的神經架構搜索可以有效縮短模型搜索時間,快速定位到具有高精度識別能力的神經網絡結構[2]。本文將一個準確度較高的竊電識別神經網絡結構設定為F,成本函數設定為Cost(·),用電數據集D分為訓練集Dtrain和測試集Dval。假設存在一個最優神經網絡結構f*,如公式(3)、公式(4)所示。
f*=argminf∈FCost(f(θ*),Dval) (3)
θ*=argminθL(f(θ),Dtrain) (4)
式中:θ*為f的結構參數;F為覆蓋全部神經架構。
3.2 基于神經架構搜索的竊電識別模型
本文構建的竊電識別模型由卷積層、全連接層和輸出層組成。卷積層負責從輸入的電表數據中自動提取有用的局部特征。全連接層負責將這些特征進行整合,可將提取的多維特征向量壓縮為一個更低維度的特征空間,從而用于最終的分類或回歸任務[3]。輸出層負責對整合后的特征進行加權求和,并輸出一個表示竊電嫌疑度的數值。該層會使用Sigmoid或者Softmax作為激活函數,以便輸出1個0~1的概率值。
3.3 竊電檢測流程
需要收集足夠的電力使用數據,包括正常使用和竊電情況。數據需要經過清洗、歸一化和標注等預處理步驟,使其適用于后續的模型訓練。在此階段,本文應用神經框架搜索進行模型自動搜索。利用貝葉斯優化或其他策略,系統會自動評估并選擇最佳的神經網絡架構。選定最佳網絡架構后,使用標注的數據進行模型訓練。利用深度學習技術,模型會學習到竊電和正常用電間的區別。一旦模型訓練完成,就可以使用該模型對新的電力使用數據進行竊電識別[4]。
4 性能評估
4.1 數據集
本文將數據集導入竊電識別模型,去除數據中顯示為“Nan”的數據,剩余數據均為真實有效的用電數據。對有效數據進行預處理,最終得到竊電識別數據(見表1)。
4.2 數據預處理
不同用戶的用電量差異巨大,為避免出現甲用戶與乙用戶在單位時間內用電量下降比例不同,需要對過濾后的有效數據進行歸一化運算,將原始數據轉變為無綱數,如公式(5)所示。
(5)
式中:W為原始數據序列;W'為經過歸一化處理的數據序列。
4.3 驗證方法
本文引入多折交叉驗證模型。該模型適用于僅有一個預測目的場景,與本文研究的“預測用戶是否為竊電用戶”的目標一致。
4.4 性能指標
通常情況下,在一個大的供電區域中,有竊電行為的用戶數量極少,因此在利用用戶用電數據判斷竊電行為的過程中,正常用電數據與竊電用戶的用電數據比例差異懸殊,如果采用傳統的準確率比較,就容易出現誤差。其原因在于絕大用戶被判定為“非竊電用戶”,該判斷的準確率通常會超過90%,但該判斷結果無法準確反映本文設計的竊電識別算法的性能。因此,本文引入精準率評價指標、召回率評價指標以及綜合評價指數F1,將3項指標代入折交叉驗證法中,進而印證基于神經網絡搜索算法的竊電識別模型的有效性[5]。這3項指標的計算過程如公式(6)~公式(8)所示。
(6)
(7)
(8)
式中:Precision為精準評價指數;Recall為召回率評價指數;TP為“竊電用戶集”中被判定為竊電用戶的用戶數;EP為“正常用戶集”中被判定為竊電用戶的用戶數;FN為“竊電用戶集”中被判定為正常用戶的用戶數。
竊電檢測工作的核心是確保準確性和查全率。如果檢測方法不夠準確,可能會導致誤判,從而引發不必要的人力和物力投入,甚至可能侵害無辜消費者的權益。相反,如果檢測方法查全率低,可能會導致許多竊電行為逍遙法外,從而加劇電力公司的經濟損失。因此,本文引入F1分數作為評價指標。該指標是查全率(召回率)和查準率(精確率)的調和平均值。查全率反映了檢測方法查出所有竊電行為的能力,查準率則反映了被檢測出來的竊電行為中真實竊電行為的比例。F1分數綜合考慮了這2個方面,為相關研究人員提供了一個全面、準確的評估工具。通過不斷優化竊電檢測方法,提高F1分數,電力公司能更有效地打擊竊電行為,確保誠信和公平。
4.5 試驗結果
神經框架搜索算法竊電識別模型混淆矩陣見表2,其中TN為“正常用戶集”中被判定為正常用戶的用戶數量。分析表2中的數據可以發現,FN的280個用戶被劃入“竊電用戶集”的主要原因在于這部分用戶缺失值信息較少,該模型無法利用缺失值信息對其進行準確識別。被該模型識別為竊電用戶與非竊電用戶的電力用戶數量分布如圖1所示。
隨機從“使用原始數據”的簇和“使用特征提取”的簇中調取9位用戶的用電數據,并對該數據進行可視化轉化(如圖2所示)。
圖2中,橫軸為用電天數,縱軸為月數,其中黃色部分為“有數據缺失”的用電數據。分析圖2可以明顯看出,未被該模型識別為“竊電用戶”的缺失值很少,其平均數量僅為6;而被判定為“竊電用戶”的數據中,存在數據缺失的數據數量較多,平均為539個。由此可以證明,利用數據缺失信息能夠較準確地判斷用戶是否存在竊電行為。
需要注意的是,上述試驗采集數據的間隔為1天。如果用戶采用打開電表蓋子的方式進行竊電且“開蓋→修改數據”行為發生在一天之內,則模型不會讀取到該用戶存在數據缺失的問題。因此,如果僅使用缺失值信息來判斷用戶是否有竊電行為,則無法檢測出使用開蓋修改數據方式進行竊電活動的用戶。針對該問題,本文嘗試將開蓋數據與存在缺失值的數據進行融合,令該模型能夠覆蓋絕大多數竊電行為判斷場景。此外,對“正常用戶集”中被判斷為“竊電用戶”的81個用戶進行深入分析可知,產生誤判的主要原因如下。1)在采集數據過程中會有一定的數據包丟失概率,導致該用戶的用電數據不完整,進而導致模型判斷錯誤。2)集中器發生故障,導致用戶的用電數據丟失,被模型判斷為“竊電用戶”。
5 結論
本文采用基于神經架構搜索的方法對智能電表進行竊電識別,取得了一定成果。該成果揭示了在電能竊取行為中,基于神經架構搜索的模型具有較好的性能和高效的特征學習能力。在理論方面,本文深入挖掘了神經架構搜索的潛力,為智能電表竊電識別領域提供了新的思路和方法。自動搜索合適的神經網絡結構可以大幅減少人工設計模型的工作量,并能獲得更好的性能。在實際應用方面,基于神經架構搜索的智能電表竊電識別方法具有實際應用價值。準確識別電能竊取行為可以幫助電力公司及時發現非法竊電行為,有效降低電網安全風險和經濟損失。未來可以進一步優化搜索算法、提高效率,并結合硬件優化等技術進行應用。此外,本文使用的數據集也可以進一步擴充和完善,以提高模型的泛化能力和適用性,為電力系統的安全與管理做出更大貢獻。
參考文獻
[1]湯淵,吳裕宙,蘇盛,等.基于改進深度極限學習機的光伏擴容用戶識別方法[J].電力系統及其自動化學報,2022,35(11):13-16.
[2]鄒念,張穎,蘇盛,等.基于小時尺度周期特征自編碼器的用戶竊電識別方法[J].電網技術,2023,47(6):2558-2567.
[3]馮小峰,姚誠智,楊俊華.基于Stacking集成學習的竊電檢測研究[J].電測與儀表,2023,12(8):10-12.
[4]劉文浩,馮玥,姜東良.基于AMI數據驅動的竊電用戶識別研究[J].制造業自動化,2022,44(11):5-8.
[5]夏睿,高云鵬,朱彥卿,等.基于SE-CNN模型的竊電檢測方法研究[J].電力系統保護與控制,2022,50(20):117-126.