














摘" 要: 電動汽車充放電系統是新能源汽車安全充放電的重要保障。為了解決電動汽車充放電系統的通信協議辨識問題,提出一種基于混合深度學習的電動汽車充放電系統通信協議辨識方法。該方法通過深度學習網絡(DLN)提取通信協議數據特征,通過引入[l1/2]范數提高深度學習網絡的泛化能力,實現對電動汽車充放電系統通信協議的高精度辨識。仿真結果表明,混合深度學習網絡對電動汽車充放電系統不同協議的辨識總體準確率達到了97.68%。因此,可以得出基于混合深度學習的電動車充放電系統通信協議辨識方法具有一定的有效性。
關鍵詞: 電動汽車充放電; 協議辨識; 深度學習網絡; [l1/2]范數; 評估指標; 泛化能力
中圖分類號: TN919.6?34" " " " " " " " " " " " 文獻標識碼: A" " " " " " " " " " " " "文章編號: 1004?373X(2024)17?0041?06
Communication protocol identification method based on hybrid deep learning
for electric vehicle charging and discharging system
Lü Xiaorong1, HUI Qi1, XU Zimin2
(1. NARI?TECH Nanjing Control Systems Co., Ltd., Nanjing 210000, China;
2. College of Automation amp; College of Artificial Intelligence, Nanjing University of Posts and Telecommunications, Nanjing 210000, China)
Abstract: The electric vehicle (EV) charging and discharging system is an important guarantee for the safe charging and discharging of the new energy vehicles (NEVs), so a communication protocol identification method based on hybrid deep learning for the EV charging and discharging system is proposed to cope with the communication protocol identification of the system. In this method, the communication protocol data features are extracted by the deep learning network (DLN), and the generalization ability of this network is improved by introducing norm [l1/2], so as to achieve high?precision identification of the communication protocols of the EV charging and discharging system. The simulation results show that the overall accuracy (OA) of the hybrid deep learning network for the identification of different protocols of the EV charging and discharging system reaches 97.68%, which indicates the effectiveness of the communication protocol identification method for the EV charging and discharging system based on hybrid deep learning.
Keywords: EV charging and discharging system; protocol identification; DLN; norm [l1/2]; evaluation indicator; generalization ability
0" 引" 言
由于能源危機和環境問題的逐漸顯現,發展電動汽車和充電設備成為全世界的必然趨勢[1?2]。電動汽車充放電系統通信協議將電動汽車和充電設備統一起來,保證不同的電動汽車和充電設備之間能夠互聯互通[3]。但在電動汽車和充電設備互聯互通的過程中存在通信協議不一致的問題,為了確保電動汽車的充放電過程能夠更加高效和安全,通過協議辨識技術保證協議統一是至關重要的問題。
針對通信協議辨識技術,國內外研究學者都做了大量的研究。文獻[4]針對通信過程中匿名協議對協議辨識任務產生的巨大挑戰,提出了一種基于卷積神經網絡(CNN)的完全加密流量匿名協議辨識方法,經實驗論證,辨識準確率可達到96%。文獻[5]提出一種融合SENet和Transformer的應用層協議辨識方法,解決了現有協議辨識方法存在的提取協議特征不充分等問題,此方法可以提取更多有效協議特征,提高協議辨識性能。文獻[6]創建網絡協議分析庫,通過深度學習算法提高協議辨識的準確度。文獻[7]研究了采用卷積層和降采樣層提取深層次特征的協議辨識技術,經訓練后的協議辨識模型分類準確性得到很大的提高。文獻[8]提出了一種基于卷積神經網絡的應用層協議辨識方法,經實驗論證,該方法的總體辨識準確率約為99.70%。文獻[9]提出一種基于多維卷積神經網絡結合無監督訓練網絡的信息協議特征提取方法,仿真結果驗證了此方法的有效性。文獻[10]提出一種由條件變分自動編碼器(CVAE)和隨機森林(RF)分類器組成的組合架構,用于自動學習輸入特征之間的相似性,實驗結論表明,所提出的體系架構能夠有效提取特征,提高協議辨識模型的準確度。
綜上所述,國內外研究學者在通信協議辨識領域已經進行了一些相關研究,并提出了一些有效的通信協議辨識方法。然而針對電動汽車充放電系統的通信協議辨識方法的研究仍然較少,本文基于當前電動汽車大力發展的趨勢,旨在提出一種針對電動汽車充放電系統的通信協議辨識方法來彌補這一研究的空白。因此,本文提出一種基于混合學習網絡的電動汽車充放電系統通信協議辨識方法。電動汽車充放電系統架構如圖1所示。
本文提出的混合學習網絡模型,結合了深度學習網絡(Deep Learning Network, DLN)和[l1/2]正則化,利用深度學習網絡對電動汽車充放電系統協議的非線性擬合能力,同時引入[l1/2]范數設計輸出權重的估計方法,可以從海量數據中學習到許多復雜的非線性數據,從而形成表達能力強、泛化性能好的特征[11],提高電動汽車充放電系統通信協議辨識性能。此方法不僅有望解決電動汽車通信協議辨識性能方面的技術難題,更能夠提高系統的安全性和高效性,為電動汽車行業發展提供了一定的技術支撐。
1" 基于混合學習網絡的電動汽車充放電系統通信協議識別方法
1.1" 通信協議辨識方法概述
通信協議辨識方法通過提取電動汽車充放電系統通信數據中的關鍵特征進行分析,準確辨識流量所屬的通信協議,協議辨識有助于對流量的結構進行分析,為系統的正常運行提供保障。本文研究的是在電動汽車充放電系統中對充電樁和樁端管理單元之間的通信協議進行辨識。通信協議辨識方法分為三部分,分別是數據預處理部分、模型訓練部分和模型測試部分。通信協議辨識方法的工作流程如圖2所示。
通信協議辨識方法的三個階段具體步驟介紹如下。
步驟1:數據采集步驟使用Wireshark抓包工具收集通信原始數據[12];
步驟2:數據預處理步驟首先對數據進行清洗,然后濾除干擾的噪聲數據,確保數據的質量和一致性,最后將經過處理后的數據格式轉換成符合要求的格式;
步驟3:數據集劃分階段將經過處理的數據按照一定比例劃分為訓練集和測試集;
步驟4:將步驟3中的訓練集輸入到模型訓練階段;
步驟5:將訓練集數據放入模型中進行訓練;
步驟6:判斷數據是否符合終止條件;
步驟7:將步驟3中的測試集輸入到模型測試階段;
步驟8:將測試集數據放入訓練好的協議識別模型;
步驟9:生成協議判別結果。
1.2" 通信協議數據預處理
由于電動汽車充放電系統采集的數據大多為“臟”數據,往往表現為不完整、有噪聲和不一致性,因此在實際應用前需要進行數據預處理,確保數據具有一致性、完整性、可信性、準確性、時效性和可解釋性。數據預處理是指從原始數據中通過清洗、過濾和轉換等步驟篩選出符合條件的數據。本文所選取的方法主要可分為四個步驟,對步驟具體實施詳細介紹如下:
1) 清洗數據。電動汽車充放電系統的通信協議是本文的分析對象,將收集到的數據與所需協議無關的進行過濾,只保留相關的協議數據。
2) 數據切分。模型的訓練往往對輸入數據的格式要求比較嚴格,因此數據切分步驟的目的就是使后續的輸入是固定長度的數據。電動汽車充放電系統的通信協議數據辨識可以參考相似度較高的首部信息,而載荷部分的相似度一般較低,對協議辨識的參考意義不大。
3) 數據歸一化。數據歸一化的目的是確保不同特征之間具有相似的數據范圍,避免某些特征對模型產生過大的影響,從而提高模型的準確性和穩定性。本文將分量值轉化成0~1的數值,從而實現歸一化。
4) 數據標注。本文可以采取獨熱編碼對數據進行標注。獨熱編碼是一種常用的分類變量編碼方法,用于將具有多個類別的離散特征轉換為機器學習模型能夠處理的數值形式[4]。該方法將每個類別映射為一個長度等于總類別數的二進制向量,只有相應類別的位置為1,而其他位置為0,這樣的編碼方式消除了類別之間的大小關系,使得模型能夠更好地理解和處理分類信息。
1.3" 混合學習網絡
1.3.1" 深度神經網絡的結構
深度神經網絡是一種多層無監督神經網絡。在深度網絡中,上一層的輸出特征將作為下一層的輸入進行特征學習。由于具備深度學習的特點,該學習網絡具有很強的特征提取和數據擬合能力。通過逐層特征映射后,該學習網絡可以將現有空間樣本的特征映射到另一個特征空間,對現有輸入具有更好的特征表達[13]。深度神經網絡具有多個非線性映射的特征變換,可以對高度復雜的函數進行擬合。深度神經網絡結構如圖3所示。
1.3.2" 混合神經網絡的訓練過程
本文采用基礎深度學習網絡作為通信協議辨識方法的核心,利用[l1/2]范數設計輸出權重的估計方法,通過訓練獲得良好的混合神經網絡,最終實現充電樁充放電控制系統通信協議的有效辨識。
因此,本文的混合神經網絡在訓練過程的各個網絡層可以描述為:
1) 輸入層的數據可以描述為[X∈RP×N1]。其中:[P]為充電樁充放電控制系統通信協議的辨識種類;[N1]為輸入層中包含的神經元數目。在本文中,輸入層中包含神經元的數目等同于各個通信協議數據的數目。
2) 隱含層的輸入數據可以描述為:
[Hn=tanhHn-1Wn-1,nin+Bn-1,nin] (1)
式中:[Hn]和[Hn-1]分別為第[n]層隱含層和第[n-1]層隱含層的輸出數據矩陣;[Wn-1,nin]和[Bn-1,nin]分別為第[n]層隱含層與第[n-1]層隱含層之間的連接權重矩陣和偏置矩陣,[n=2,3,…,N],[N]為隱含層的總數目;[tanh(·)]是雙曲正切函數,為本文混合學習網絡模型的激活函數。
當[n=1]時,公式(1)可以改寫為:
[H1=tanhXW1in+B1in] (2)
式中:[H1]表示第1個隱含層的輸出數據矩陣;[W1in]和[B1in]分別表示第1個隱含層與輸入層之間的連接權重矩陣和偏置矩陣。
3) 輸出層的輸出數據可以表示為:
[Y=HNWout] (3)
式中[Wout]為第[N]個隱含層和輸出層之間的連接權重矩陣,即混合學習網絡的輸出權重矩陣。在本文中,[Wout]通過關于[l1/2]范數的最小損失函數進行求解。
1.3.3" 混合神經網絡的輸出權重的估計方法
在本文中,混合神經網絡的核心是深度神經網絡。由于在實際應用中,深度神經網絡需要對大量數據進行訓練,這會導致特征維度過多、模型假設過于復雜和噪聲過多,進而出現過擬合問題。因此,本文在深度神經網絡中引入[l1/2]范數,對模型的權重進行懲罰,減少過擬合的風險,提高深度神經網絡的辨識性能。
在本文中,混合神經網絡的目標函數如下:
[J=minWoutY-XWout22+λWout1212] (4)
式中:[·12]是[l1/2]范數;[λ]是懲戒系數。由于損失函數(4)具有非凸、非平滑特性,本文通過坐標下降法來求解損失函數(4)。
在坐標下降算法中,每次只更新一個參數[Wout,k],[k=1,2,…,p],其他系數保持不變。那么對于[Wout,k],本文基于損失函數(4)進行以下推導:
[Jk=i=1SYmi-XkiWout,k-j≠kpXjiWout,j2+λWout,k12+j≠kpWout,j12] (5)
式中[Wout,j]表示上一步保持不變的參數。本文中坐標下降算法[14]具體描述如下:
步驟1:令[Wintout,m=0,m=1,2,…,M],給定一個非負常數[λ];
步驟2:令[Wout,m=Wintout,m];
步驟3:計算[Wout,mk,k=1,2,…,p],如果[Cmk≥34λ23mk],[Wout,mk=23Cmk1+cos23π-23φ],否則[Wout,mk]=0,其中,[Cmk=i=1Symi-j≠kpxjiWout,mjxkii=1Sxki2],
[λmk=λi=1Sxki2],[φ=arccosλmk8Cmk3-32];
步驟4:如果[k=1pWout,mk-Winkout,mklt;10-4],算法停止,否則,令[Wintout,m=Wout,m],返回步驟2;
步驟5:輸出[Wout,m=Wout,m1,Wout,m2,…,Wout,mpT]。
本文利用坐標下降算法求解損失函數(4),可以在每次迭代中只更新一個參數,從而降低了計算的復雜性。另外,由于懲罰項會迫使某些權重為0,坐標下降算法可以很好地解決由此造成的稀疏性問題,這對于具有大量特征的問題來說尤為關鍵。
2" 實驗分析與討論
為了驗證混合深度學習網絡對電動汽車充放電控制系統通信協議辨識方法的有效性,本文主要從以下幾個方面進行分析與討論:
1) 分析不同字節數據對混合深度學習網絡模型性能的影響;
2) 選取不同的評估指標對混合深度學習網絡的辨識性能進行分析,判斷混合深度學習網絡性能的有效性;
3) 選取不同模型,根據相應的評估指標對比混合深度學習網絡模型和其他模型的性能優越性。
2.1" 評估指標
為了驗證本文方法是否有效,首先選取適當的評價指標對電動汽車充放電系統通信協議辨識模型進行評估判別。
基于文獻[15],本文采用混淆矩陣輔助計算評估指標,混淆矩陣如表1所示。其中,準確率(Accuracy, AC)、召回率(Recall Ratio, RR)、精確率(Precision, PR)、[F]值([F1]?measure, FM)、總體精確率(Overall Accuracy, OA)是所選取的主要指標,計算公式如式(6)~式(10)所示:
[AC=TP+TNTP+TN+FP+FN] (6)
[RR=TPTP+FN] (7)
[PR=TPTP+FP] (8)
[FM=2PR?RRPR+RR] (9)
[OA=i=1NTPiN] (10)
式中[N]表示樣本總數。
2.2" 電動汽車充放電系統通信數據集
考慮到電動汽車充放電控制系統的互聯互通需求,本文主要考慮有線通信協議、局域無線通信網絡協議和廣域無線通信協議進行評估和測試,即CAN協議、Modbus協議、RS 485協議、IEEE 802.11g協議和IEEE 802.11ac協議。
根據上文所提到的數據預處理方法,得到的實驗數據集信息如表2所示。將得到的實驗數據集打亂順序,隨機劃分為訓練集和測試集,比例設置為7∶3,即選取35 000個數據作為訓練集,15 000個數據作為測試集。訓練集用來訓練模型,測試集用來對模型進行評估。另外,深度神經網絡輸入層神經元個數為10,輸出層神經元個數為1,隱含層層數設置為5,隱含層神經元個數為7,正則化參數通過10折交叉驗證進行確定。本課題選取電動汽車充放電控制系統的CAN協議、Modbus協議、RS 485協議、IEEE 802.11g協議和IEEE 802.11ac協議進行辨識。因此,所選取協議的獨熱編碼處理可以分別表示為[1,0,0,0,0]T、[0,1,0,0,0]T、[0,0,1,0,0]T、[0,0,0,1,0]T、[0,0,0,0,1]T。
2.3" 不同字節長度的辨識精度分析
不同的通信協議采用不同的字節長度來傳遞信息,合適的字節長度可以提高協議辨識精度,增強系統通信的穩定性和可靠性,因此選擇合適的字節長度對于準確辨識通信協議至關重要。本文選取0~1 000 B長度的數據分析其對辨識精度的影響,得到的不同字節長度辨識精度如圖4所示。
從圖4中可以看出,隨著字節長度的增加,辨識精度也隨之增加。在700~800 B之間辨識精度達到最大值,當大于800 B時,辨識精度就有所下降,參考文獻[8],選取784 B大小作為后續模型的輸入。數據長度超過784 B的,舍棄多余部分,數據長度小于784 B的,在末尾填充0補全。
2.4" 混合學習網絡的辨識性能分析
本文通過選取總體準確率、平均[F]值、召回率和精確率作為評價指標,驗證本文混合深度學習網絡模型的有效性。不同協議的評價指標對比如表3所示。
由表3可知,深度學習網絡對不同協議的辨識總體準確率達到了97.68%,說明其對不同協議的辨識都較好。由式(9)可知,[F]值是由準確率和召回率共同得到的,因此[F]值能夠很好地衡量模型的精度。可以看出,CAN、Modbus、IEEE 802.11ac三種協議的[F]值均達到了99%以上,說明本文模型對這三種協議的辨識性能最好。
2.5" 不同模型的辨識性能分析
本文選取深度學習網絡模型、本文結合[l1/2]范數的深度學習網絡模型、文獻[5]中提到的融合SENet和 Transformer模型以及文獻[8]中基于卷積神經網絡模型進行對比實驗,選取[F]值作為評價指標,對比結果如表4所示。由表4可以看出,本文模型對于不同協議的[F]值都是最優的,說明辨識性能優于其他三種模型。文獻[5]和深度學習網絡模型辨識性能優于文獻[8]提出的卷積神經網絡模型,文獻[8]模型的效果最差;文獻[5]的融合SENet和Transformer模型優于深度學習網絡模型。
3" 結" 語
本文主要考慮了電動汽車充放電系統中通信協議的辨識問題。主要基于[l1/2]范數和深度神經網絡的混合深度學習網絡,本文提出一種電動汽車充放電系統通信協議辨識的新方法。首先通過對數據進行預處理,選取合適的數據集;其次構建混合深度學習網絡模型,考慮深度學習網絡模型在應對大量數據時存在的過擬合問題,引入[l1/2]范數懲罰深度學習網絡的權重,提高神經網絡模型的辨識性能;最后通過實驗驗證本文提出的混合深度學習網絡的有效性。選取準確率、召回率、[F]值和總體準確率作為評估指標,分析混合深度學習網絡的辨識性能,得到其總體準確率達到了97.68%,說明其辨識性能較好。因此,本文提出的基于混合深度學習網絡的電動汽車充放電系統通信協議辨識方法具有一定的可行性和有效性。
注:本文通訊作者為許子旻。
參考文獻
[1] 李孝安,樓嫣嵐,陳舟凱,等.電動汽車快速增長下臨平充電設施布點規劃[C]//人民城市,規劃賦能:2023中國城市規劃年會論文集(03城市工程規劃).北京:中國城市規劃學會,2023:72?79.
[2] 劉波,黃旭楠,郝嘉雪,等.防霾大數據與新型教室除霾器試點[J].現代電子技術,2019,42(11):144?148.
[3] 葉瓊瑜,任悅,陳政熙.電動汽車和充電樁間通信網絡的信息安全研究[J].集成電路應用,2022,39(5):9?13.
[4] 白惠文,馬雪婧,劉偉偉,等.基于深度學習的匿名協議流量識別技術研究[J].計算機仿真,2021,38(7):360?365.
[5] 陳乾,洪征,司健鵬.融合SENet和Transformer的應用層協議識別方法[J].計算機科學與探索,2024,18(3):805?817.
[6] 葉松.基于現代網絡的深度學習應用協議識別技術研究與實現[J].軟件導刊,2018,17(10):194?199.
[7] 彭博一.基于深度學習的協議識別技術研究[D].北京:中國工程物理研究院,2020.
[8] 馮文博,洪征,吳禮發,等.基于卷積神經網絡的應用層協議識別方法[J].計算機應用,2019,39(12):3615?3621.
[9] REN J, LI S, SONG Y H, et al. Deep learning based identification method for signal?level wireless protocol [J]. IEEE access, 2022, 10: 118187?118197.
[10] MONSHIZADEH M, KHATRI V, GAMDOU M, et al. Impro?ving data generalization with variational autoencoders for network traffic anomaly detection [J]. IEEE access, 2021, 9: 56893?56907.
[11] 郭志濤,雷瑤,袁金麗,等.基于深度學習的交通標志識別算法研究[J].現代電子技術,2019,42(22):164?168.
[12] 吳吉勝,洪征,馬甜甜,等.基于殘差網絡和循環神經網絡混合模型的應用層協議識別方法[J].計算機科學,2022,49(11):293?301.
[13] 武宇翔,韓肖清,牛哲文,等.融合多注意力深度神經網絡的可解釋光伏功率區間預測[J/OL].電網技術:1?19[2023?08?14].https://doi.org/10.13335/j.1000?3673.pst.2023.0978.
[14] 牛玉琪.一類基于GSL規則改進的坐標下降法[D].蘭州:蘭州大學,2020.
[15] 王琪.基于混合神經網絡的自動睡眠分期算法研究[D].南京:南京信息工程大學,2023.