潘垂宇 李雪 許立超 張志 陳雷
(1.中國第一汽車股份有限公司新能源開發院,長春 130013;2.汽車振動噪聲與安全控制綜合技術國家重點實驗室,長春 130013)
主題詞:動力電池 大數據 充電電壓恢復率 開路電壓


近年來,電動汽車發展迅速,更是成為了國家十四五戰略規劃的一部分。但是新能源汽車仍然有很多需要解決的問題,電動汽車開路電壓預測是其中之一。
鋰離子電池在開路狀態下的端電壓稱為開路電壓(OCV)。電池的開路電壓等于電池在斷路時(即沒有電流通過兩極時)電池的正極電極電勢與負極電極電勢之差。
開路電壓的估計是電池荷電狀態(SOC)預估的重要基礎。當電池處于靜態或無負載狀態時,電池端電壓和SOC存在一定的數學比例關系,而SOC對于電池特性分析、自放電特性預估、電池管理系統設計都有著重要作用。
當電動汽車處于行駛狀態時,很難準確測量到開路電壓,因此,開路電壓的估計就非常重要。
目前主要流行的開路電壓的估計方法可分為試驗法、基于模型法、數據驅動法等。
(1)試驗法
試驗法的方法是在試驗中的“充分靜置法”,將充放電后的鋰電池進行充分靜置,讓其端電壓恢復至開路電壓。該方法存在著無法規避的缺點,即在進行OCV估算之前電池必須經過長時間靜置。
該試驗法得出開路電壓的標準方法為:分別在對應溫度下,以1C/1C充放電倍率對電池當前溫度下的可用容量進行測試。以0.1C倍率放電,每放出可用容量的10%,靜置3 h,靜置后電池端電壓即為對應SOC狀態開路電壓。
上述方法表明,電池經過長期靜置,其開路電壓穩定且可與SOC對應。但是,新能源汽車實車很難按照該試驗狀態使用,所以試驗法并不能適用于實車的開路電壓預估。
(2)基于模型法
汽車在行駛過程中經歷反復的放電-回饋過程,即使出現汽車在紅燈時駐車情況,由于停歇時間很短,因此也很難達到穩態開路電壓。
武國良等提出非穩態開路電壓模型,利用等效電路模型參數辨識電池的一階等效電路模型,來分析包括充電停歇狀態和放電停歇狀態的非穩態開路電壓模型。
付浪等提出一種新的辦法,通過對電池放電曲線及恢復曲線分析,結合電池等效模型,擬合出開路電壓的計算公式。將放電停止后的某時刻電壓用卡爾曼濾波法估計電池的開路電壓。不但解決了傳統估算中開路電壓法用時長的問題,而且提高了開路電壓值的準確性。
但是,卡爾曼濾波算法是基于最小方差誤差的思想提出的一種遞推算法,其本身也是以電池的Thevenin為模型和基于模型法有類似的問題,同時卡爾曼濾波的運算復雜,也有一定缺點。
綜上,基于模型法需要模擬出電池的各種參數,但是隨著電池的衰減及不同電池的一致性差異,也很難做到非常精確的預測開路電壓。
(3)基于數據驅動法
這類方法主要可用于以下3類情況:被控系統的數學模型完全未知;被控系統的模型不確定較大;被控系統結構過于復雜或模型階數過高等類型系統。常用的數據驅動類算法如神經網絡(Neural Network,NN)等。可以在不了解電池內部結構的情況下,利用大量電池在實際工況下的數據作為訓練數據集。但是,目前通過數據驅動對于開路電壓的預估,還處于探索階段。
現在的新能源汽車的遠程服務均基于GB/T 32960.3—2016《電動汽車遠程服務與管理系統技術規范第3部分:通信協議及數據格式》的數據資源,所以使用基于數據驅動法是很好的預測手段,同時最新的新能源汽車具有空中下載技術(OTA)功能,通過該功能可以將云端學習的結果寫入汽車之中,對汽車的電池管理系統(BMS)實現不斷迭代,預測越來越準確。
本文基于數據驅動法對電動汽車的OCV進行預估,其步驟包括數據準備、數據預處理、電池開路電壓預測特征構建、機器學習及結果分析4部分進行闡述。
所使用數據為某新能源公司投放使用的某款純電動汽車在2021年的數據,數據采集頻率為0.1 Hz。數據由安裝在汽車上的車載數據采集設備獲取,數據傳輸按照GB/T 32960.3—2016執行,數據由車載TBox傳輸至后臺服務器。
電動汽車在停車后一般就會停止數據上傳。但是此時車輛的SOC、極化、溫度、自放電特性均不穩定,下電時刻的電壓值不能作為開路電壓。
在停車時長滿足充分靜置后的車輛在啟動時,電流和車速均為0,理論上可以認為此時的端電壓為開路電壓,但是每次車輛的停放時長、車輛狀態是不確定的,對于數據應用,仍然需要對開路電壓進行預測。
為了預測該值,需要對上述各因素進行總結和大量數據的有監督機器學習分析。
本文采用智協慧同(北京)科技有限公司的EXD軟件作為服務器端數據篩選的工具。為了滿足車輛充分靜置的條件,采用了電動汽車停放超過1 h的數據。因此,電動汽車停放工況相應的數據特征需同時滿足表1所示所有條件。

表1 電動汽車停放工況條件
統計時間為2021年的數據,經上述簡單判定后,符合條件的車輛有974臺。
為了縮小數據范圍,提升數據計算效率,擬從里程占比、月行駛次數占比兩個維度對數據進行二次篩選。圖1是974臺車運行里程的統計,從圖1可以看出車輛里程分布普遍低于30 000 km,超過30 000 km的數據舍棄。圖2是對月行駛次數的分布統計,為了統計相對活躍車輛,舍棄月行駛次數5次以下的車輛。

圖1 電動汽車里程占比

圖2 電動汽車月行駛次數占比
根據上述分布,將數據范圍進一步規范,方法如下表2所示:

表2 數據條件范圍精確表
進一步對數據進行清洗,發現如“SOC大幅下降,絕緣值下降,溫度上升”、“里程不變的情況下,SOC下降明顯”、“SOC為100不變,但是總電壓有明顯降低”等狀態異常車輛,通過數據分析和實車監控,將異常車輛排除。
同時發現如表3的混淆數據。

表3 數據質量異常表
將上述表3車輛清洗去除后,還有850臺車輛的運行數據符合條件。
機器學習中,為使算法達到最優性能,須通過特征工程對數據進行處理使原始數據轉化為特征,從而對數據中所包含的信息進行充分挖掘,使模型能夠更好地進行學習。因此須構造車輛起動瞬間及車輛下電前的相關特征,以便模型進行學習與訓練。
影響開路電壓的預測可能包含電池極化、電池自放電、電池壽命、電池溫度等原因。
蔡信等分析了影響動力電池SOC的因素,描述了動力電池極化、電池遲滯效應對OCV的影響。由于遲滯效應的存在,電池OCV根據電流大小、環境溫度、充放電歷史因素的不同,同一SOC點,會得到不同的與之對應的OCV值。
根據上述影響因素,本文選取了里程、電流、車速、溫度、電壓和停車前狀態信息進行特征構建。
為保證動力電池開路電壓的預測精度,且保證計算負荷在可接受的范圍內,本文選取的特征值如表4所示。

表4 開路電壓預測特征表
值得說明的是,序號2的車輛累計里程代表車輛到目前為止的累計里程;
序號3~4的車輛停放前/后電池最高溫度,為車輛在停車前后的溫度。用于分析溫度對電池自放電的影響;
序號5的車輛停放的時間間隔,用于從時間維度分析自放電的影響;
序號6~7的車輛停放前后的總電壓及電壓,用于判斷自放電,同時車輛停放后的電壓也是機器學習的預測值;
序號8的停車前6幀的狀態,車輛前6幀一般可以認為是停車前1 min的情況。用于分析車輛在停車前是處于充電、行駛還是靜止狀態;
序號9~11的停車前6幀的電流最大、最小和平均值,用于獲取停車前1 min內的電流變化;
序號12~14的停車前6幀的車速,用于獲取停車前1 min的車速變化。
機器學習當前采用的技術主要包括分類、回歸分析、聚類、關聯規則和特征分析,在數據挖掘過程中根據不同分析目標選擇不同的手段進行模型構建。
其中回歸是數據挖掘最常采用的分析方式之一,回歸算法包括分類回歸樹(CART)、線性回歸、多項式回歸和嶺回歸。
線性回歸法適合特征之間高度線性相關的場景,而電池開路電壓預估各因素之間存在著復雜的、動態的非線性關系,導致模型擬合效果不理想。
多項式回歸相較于線性回歸可以更好的表達復雜關系,但是對于非線性數據或者數據特征間具有相關性多項式回歸難以建模。
嶺回歸相較于多項式回歸更不容易過擬合,但是解釋性很差。
對開路電壓預測,從車速、溫度、電流、停放時間維度進行非線性分析,且基于工程開發中對于各項參數的貢獻度可解釋性的原則,本文采用隨機森林回歸算法。該算法即集成了CART算法中的可解釋性及非線性特點,又通過引導聚集算法(Bagging)避免了過擬合和穩定性差的缺點。
隨機森林回歸算法采用CART作為元分類器,用Bagging方法生成每棵決策樹的隨機訓練樣本集,并且在構建單棵樹時,隨機地選擇訓練樣本中的特征來決定決策樹的節點分裂。Bagging方法和CART的結合,再加上隨機選擇特征進行屬性分裂,使得RFR能較好容忍噪聲。
隨機森林回歸算法是由多個決策樹{(,),=1,2,…,}組成的組合分類器,其中{}是獨立同分布隨機向量,通過對所有決策樹結果進行綜合投票,而產生輸出結果。
一個隨機森林回歸算法由N棵決策樹構成,每棵決策樹(如決策樹T1,T2,…,TN)是一個分類器,隨機森林回歸算法的決策結果由所有決策樹分類結果的組合策略得出,如圖3所示。

圖3 隨機森林回歸算法決策樹
機器學習回歸的評價常用決定系數R-Squared(R)來表示。Jason D.Rights等描述R通常理解為預測方差與結果方差的比例,觀測值與真實值的殘差平方和比例,可表示兩變數間的線性相關程度擬合程度,R的值越接近1,說明回歸預測的擬合程度越好;反之,R的值越小,說明回歸預測對實際值的擬合程度越差,見式(1)。

全體狀態的機器學習選取整體數據的75%作為測試集,另外的25%作為驗證集。
經過計算,其R為0.77,擬合度并不好,見圖4。

圖4 所有狀態隨機森林預測曲線
對此,本文提出將停車前為充電和行駛的狀態單獨進行分析,全量數據集中根據車輛靜止前的狀態,可分為“停車前為充電狀態”與“停車前為行駛狀態”兩種狀態。因此使用2種的全量數據集進行機器學習訓練。效果如下2節所示。
將停車前為充電狀態的數據整理出來,單獨進行分析(圖5),可以發現其R為0.87,充電狀態可以較好的擬合預測電壓的下降情況,即結合了電壓恢復率和自放電率的情況。

圖5 充電狀態隨機森林回歸算法預測
同時,在充電完成的狀態下,溫度和電壓差下降曲線如圖6所示,發現有明顯規律。
圖6中圈內的點均為大于10 A的電流充電導致。將上述數據剔除后可以發現一個明顯的回歸曲線(圖7)。

圖6 溫度和電壓差下降曲線

圖7 溫度和電壓差下降曲線
通過分析該曲線可以預估,目前在項目內的車輛,符合溫度-電壓下降差曲線的規律,沒有明顯自放電異常的車輛,且大多由于電池極化造成。
通過皮爾森相關性計算得出,停車前、后的電池溫度和電壓下降的相關性分別為-0.54、-0.59,電流和電壓下降的相關性為-0.43。
將停車前為行駛狀態的數據整理出來,單獨進行分析(圖8),可以發現其R為0.47沒有明顯相關性,行駛和停止狀態不能有效預測電壓恢復情況。

圖8 行駛狀態隨機森林預測曲線
本文通過數據驅動的方式對電動汽車的開路電壓進行了預測,本方法不需要搭建復雜的模型及進行長時間的靜置實驗,是非常適合現有大規模車輛實際應用的一種方法。
根據目前的數據來源,停車前為充電狀態的車輛片段,可以使用本文所提出的特征架構與隨機森林回歸算法開展符合實車使用需求的開路電壓預估,且有較高的準確性。該方法既不影響實車使用,同時成本很低,易于推廣普及。然而,目前的GB/T 32960.3—2016數據上傳頻率及本文所整理的特征信號,暫不能在停車前為行駛狀態進行預估。
同時,通過電壓下降對比溫度曲線發現,該數據范圍內車輛與溫度和電流相關性很高,根據電池的自放電特性,沒有發現明顯的自放電導致的電壓異常下降情況。
后續會通過增加數據樣本數量、對特征進一步歸類調整參數、提升上傳數據密度的方式,進一步提升預測準確性。