毛 宇,馮雪松,張曉琨,向 勇
(電子科技大學(xué)材料與能源學(xué)院,四川成都 611731)
近年來,隨著電動汽車、儲能電站等新興場景迅速發(fā)展,鋰離子電池市場規(guī)模快速增長,生產(chǎn)企業(yè)迫切需要提升產(chǎn)能[1]。典型的鋰離子電池生產(chǎn)制造過程包括正負(fù)極材料制備、隔膜生產(chǎn)、電解液配制、電池組裝、化成和分容等環(huán)節(jié),具有生產(chǎn)環(huán)節(jié)多、復(fù)雜程度高和生產(chǎn)周期長的特點(diǎn)[2]。其中,電池分容是電池產(chǎn)品性能分級的重要過程,其目的是遴選內(nèi)阻和容量一致性高的單體電池,保障電池成組后的服役可靠性。傳統(tǒng)生產(chǎn)過程中,需在分容柜中按設(shè)定的程序進(jìn)行電池充放電循環(huán),最后根據(jù)測定容量進(jìn)行分選,該過程不僅成本高,并且耗時(shí)長[3]。隨著機(jī)器學(xué)習(xí)建模技術(shù)的快速發(fā)展,利用鋰離子電池產(chǎn)線監(jiān)測數(shù)據(jù),建立電芯產(chǎn)品容量精準(zhǔn)預(yù)測模型,有望簡化甚至免除依賴充放電實(shí)驗(yàn)的分容環(huán)節(jié),支撐鋰離子電池生產(chǎn)企業(yè)提升產(chǎn)能。
機(jī)器學(xué)習(xí)算法具有快速尋找高維數(shù)據(jù)潛在關(guān)聯(lián)關(guān)系的能力,已廣泛應(yīng)用于金融、電子商務(wù)、醫(yī)療、交通、制造等領(lǐng)域。近年來,基于機(jī)器學(xué)習(xí)算法的數(shù)據(jù)驅(qū)動建模,在鋰離子電池關(guān)鍵材料性能預(yù)測和電芯剩余容量評估等方面也取得了長足進(jìn)展[4-5]。Choy等基于168 組不同摻雜配方的鋰離子電池三元NCM正極材料實(shí)驗(yàn)數(shù)據(jù),采用6 種機(jī)器學(xué)習(xí)回歸算法,研究了正極材料結(jié)構(gòu)、摻雜元素特征與其初始放電容量和第50 次循環(huán)放電容量的相關(guān)性,并成功建立了摻雜元素特征與正極材料充放電性能的映射模型[6]。文獻(xiàn)[7]采用圍繞中心點(diǎn)的劃分(PAM)聚類算法,以鉛酸蓄電池使用過程中的外殼溫度和充放電電壓、電流為特征參數(shù),設(shè)計(jì)了鉛酸蓄電池剩余容量評估方法,并以300 個(gè)報(bào)廢的鉛酸蓄電池組的服役數(shù)據(jù)為樣本驗(yàn)證了該技術(shù)有效性。在鋰離子電池方面,文獻(xiàn)[8]基于115 個(gè)電池的195 000 條數(shù)據(jù),設(shè)計(jì)了一種非遞歸的條件時(shí)間卷積網(wǎng)絡(luò)來預(yù)測鋰離子電池性能的退化行為。該模型在測試集驗(yàn)證中,電芯容量平均預(yù)測誤差小于最大可用容量的4%。盡管數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)建模在鋰離子電池關(guān)鍵材料和電源系統(tǒng)管理技術(shù)研發(fā)中已展示出巨大的潛力,但目前尚缺乏將其應(yīng)用于鋰離子電池產(chǎn)品分容的研究報(bào)道。
本文探索了基于產(chǎn)線數(shù)據(jù)驅(qū)動機(jī)器學(xué)習(xí)建模的鋰離子電池分容技術(shù)。搜集了20 997 條標(biāo)準(zhǔn)容量為108 Ah 的鋰離子電池生產(chǎn)數(shù)據(jù),使用四種機(jī)器學(xué)習(xí)算法訓(xùn)練模型,對測試集的電池分容容量進(jìn)行了預(yù)測。通過調(diào)優(yōu),所有機(jī)器學(xué)習(xí)模型容量預(yù)測結(jié)果的均方根誤差均小于標(biāo)準(zhǔn)容量的0.35%。最佳模型預(yù)測結(jié)果的統(tǒng)計(jì)分析顯示,分容容量的預(yù)測誤差在540 mAh (0.5%)以內(nèi)的電池樣品占樣品總數(shù)的比例達(dá)88.47%。該結(jié)果證明了數(shù)據(jù)驅(qū)動機(jī)器學(xué)習(xí)建模應(yīng)用于鋰電池產(chǎn)品分容的有效性。此外,通過分析預(yù)測結(jié)果較優(yōu)的兩個(gè)算法模型中各特征參數(shù)貢獻(xiàn)度,揭示了影響模型分容容量判斷的關(guān)鍵共性特征,有望支撐進(jìn)一步優(yōu)化鋰電池生產(chǎn)過程,提高產(chǎn)品品質(zhì)保障能力。
數(shù)據(jù)集由20 997 條源自同一產(chǎn)線的鋰離子電池生產(chǎn)數(shù)據(jù)組成。每條數(shù)據(jù)包括21 個(gè)特征參數(shù),分別是A 卷芯質(zhì)量、B 卷芯質(zhì)量、總卷芯質(zhì)量、第一次電解液注液量、第一次注液前質(zhì)量、第一次注液后質(zhì)量、三次化成溫度的檢測參數(shù)、三次化成截止電壓的檢測參數(shù)、第二次電解液注液量、第二次注液前質(zhì)量、第二次注液后質(zhì)量、兩次開路電壓(OCV)檢測環(huán)節(jié)的電阻大小、兩次OCV檢測環(huán)節(jié)的電壓大小、直流內(nèi)阻(DCIR)和分容容量。以上特征參數(shù)的選擇主要基于對鋰離子電池性能機(jī)理的認(rèn)識以及實(shí)際的生產(chǎn)條件,具有一定的完備性和較好的實(shí)用性。
本文使用Python 編程語言和機(jī)器學(xué)習(xí)庫(scikitlearn)進(jìn)行模型搭建及訓(xùn)練。模型中使用20 個(gè)特征參數(shù)作為協(xié)變量對鋰電池的分容容量進(jìn)行預(yù)測。模型中的每個(gè)超參數(shù)都經(jīng)過了反復(fù)調(diào)優(yōu)來使模型達(dá)到最優(yōu)的預(yù)測性能。這項(xiàng)工作中采用的四種機(jī)器學(xué)習(xí)算法包括隨機(jī)森林(random forest,RF)、梯度提升機(jī)(gradient boosting machine,GBM)、XgBoost (eXtreme gradient boosting)和CatBoost (gradient boosting+categorical features)。訓(xùn)練集和測試集按3∶1 的比例從整個(gè)數(shù)據(jù)集中通過分層抽樣的方式選取。測試集包括5 197 條鋰電池生產(chǎn)數(shù)據(jù)。
通過計(jì)算模型對測試集預(yù)測結(jié)果的均方根誤差(RMSE)和擬合度(R2)來評價(jià)模型的預(yù)測性能,計(jì)算方法如下:
式中:n是值的個(gè)數(shù)為監(jiān)測數(shù)據(jù)為預(yù)測值;為測試集中監(jiān)測數(shù)據(jù)的平均值。
模型分析可通過統(tǒng)計(jì)模型建立過程中各特征參數(shù)的貢獻(xiàn)度來進(jìn)行。特征參數(shù)貢獻(xiàn)度的計(jì)算及排序結(jié)果可使用Python 中的SHAP 包中命令來得到。
在機(jī)器學(xué)習(xí)建模之前,通過計(jì)算各特征參數(shù)與分容容量之間的皮爾森相關(guān)系數(shù)可以初步了解參數(shù)之間線性相關(guān)性的強(qiáng)弱。圖1 展示了20 個(gè)特征參數(shù)與分容容量之間的皮爾森相關(guān)系數(shù)計(jì)算結(jié)果。橫軸表示20 個(gè)特征參數(shù),縱軸表示相關(guān)性大小。從計(jì)算結(jié)果來看,所有特征參數(shù)與分容容量之間的相關(guān)性系數(shù)的絕對值均低于0.6,表明其線性相關(guān)性均較弱。但是該相關(guān)性分析結(jié)果并不能直觀地得出可靠的結(jié)論,具有一定的誤導(dǎo)性。例如,化成環(huán)節(jié)、OVC測試和DCIR的數(shù)據(jù)在理論上與分容容量之間存在較為密切的聯(lián)系,而圖1 中這三類特征參數(shù)與分容容量之間的相關(guān)性系數(shù)絕對值均低于0.3。造成相關(guān)性系數(shù)較低的原因可能是這些參數(shù)與分容容量之間的關(guān)系是較復(fù)雜的非線性關(guān)系。卷芯質(zhì)量與分容容量之間呈正相關(guān)性,并且具有較大的相關(guān)性系數(shù),其原因是卷芯中活性物質(zhì)的多少和電池容量之間關(guān)系的線性度較高。此外,根據(jù)一般認(rèn)知,電解液注入量與電極活性物質(zhì)容量發(fā)揮、電芯內(nèi)阻大小有著較緊密的聯(lián)系,是工業(yè)生產(chǎn)中十分重要的數(shù)據(jù)參量。然而,皮爾森相關(guān)性分析顯示兩次電解液注入量與分容容量的相關(guān)性均較弱。因此,主要針對線性關(guān)系的皮爾森相關(guān)性分析不能充分體現(xiàn)鋰離子電池生產(chǎn)過程對電芯產(chǎn)品性能影響的復(fù)雜性。

圖1 分容容量與20個(gè)特征參數(shù)之間的皮爾森相關(guān)性系數(shù)統(tǒng)計(jì)圖
針對皮爾森相關(guān)性分析的局限性,基于產(chǎn)線數(shù)據(jù)量充足的特點(diǎn),使用生產(chǎn)過程中能夠采集到的所有特征參數(shù)來進(jìn)行機(jī)器學(xué)習(xí)建模。利用機(jī)器學(xué)習(xí)快速尋找高維數(shù)據(jù)關(guān)聯(lián)性的能力,探究產(chǎn)線監(jiān)測特征參量與分容容量之間的復(fù)雜非線性關(guān)系,并驗(yàn)證通過機(jī)器學(xué)習(xí)建模預(yù)測鋰電池分容容量的有效性。研究中使用四種機(jī)器學(xué)習(xí)算法分別建立回歸預(yù)測模型,并針對每個(gè)模型進(jìn)行性能驗(yàn)證。表1 總結(jié)了鋰離子電池分容容量預(yù)測的四種機(jī)器學(xué)習(xí)模型的五次交叉驗(yàn)證平均RMSE,測試集預(yù)測結(jié)果RMSE與R2的評價(jià)結(jié)果,對比了特征篩選前后模型預(yù)測性能。

表1 各模型的均方根誤差和擬合度
四種算法模型的測試集預(yù)測結(jié)果的RMSE值均低于標(biāo)準(zhǔn)分容容量的0.35%,R2均大于0.55,五次交叉驗(yàn)證的平均RMSE的值均低于標(biāo)準(zhǔn)分容容量的0.39%,模型的性能初步滿足產(chǎn)線電池生產(chǎn)的標(biāo)準(zhǔn)。其中,CatBoost 算法模型和RF 算法模型對分容容量的預(yù)測效果最佳,具有最高的擬合度,分別為0.620 6和0.618 6。此外,使用根據(jù)皮爾森相關(guān)性系數(shù)計(jì)算結(jié)果(皮爾森相關(guān)系數(shù)絕對值>0.2)篩選出的8 個(gè)特征所組成的參數(shù)集,所訓(xùn)練的四種機(jī)器學(xué)習(xí)模型對測試集的預(yù)測結(jié)果相比于未進(jìn)行特征篩選時(shí)的預(yù)測結(jié)果較差,再次說明皮爾森相關(guān)性分析存在一定的誤導(dǎo)性。在未來研究中,結(jié)合產(chǎn)線機(jī)理認(rèn)識設(shè)計(jì)專用的算法模型更精確地提取產(chǎn)線監(jiān)測特征參量與分容容量之間復(fù)雜的非線性關(guān)系,將是提高模型預(yù)測性能的關(guān)鍵。
在測試集驗(yàn)證中性能表現(xiàn)較優(yōu)的RF 和CatBoost算法模型分容容量預(yù)測值和實(shí)驗(yàn)值關(guān)聯(lián)的散點(diǎn)圖如圖2 所示。對應(yīng)的R2和RMSE標(biāo)注在圖中,45°的紅色直線代表了實(shí)驗(yàn)值的大小,圖中每個(gè)點(diǎn)都代表了一個(gè)預(yù)測數(shù)據(jù)。針對5 197 條數(shù)據(jù)的預(yù)測結(jié)果大部分都接近于紅色直線。對于本研究中給定的測試集,兩種算法模型的評估結(jié)果非常接近。此外,圖中能觀察到部分預(yù)測點(diǎn)位于表示±0.5%誤差的兩條直線之外,這些預(yù)測誤差較大的數(shù)據(jù)是影響RMSE和R2數(shù)值的關(guān)鍵。通過對最佳RF 模型和CatBoost 模型預(yù)測結(jié)果的統(tǒng)計(jì)分析,發(fā)現(xiàn)測試集中實(shí)際測定容量在108 Ah 以上的電池樣品被正確判斷為容量達(dá)到108 Ah 以上的概率分別為90.78%和89.86%,剩余約10%的產(chǎn)品可通過實(shí)驗(yàn)分容進(jìn)一步測定容量。分容容量的預(yù)測誤差在540 mAh(標(biāo)準(zhǔn)容量的0.5%)以內(nèi)的電池樣品占樣品總數(shù)的比例分別為88.14%和88.47%。本研究建立的模型對于電芯容量是否高于108 Ah 的識別準(zhǔn)確率基本能夠滿足產(chǎn)線應(yīng)用進(jìn)行產(chǎn)品質(zhì)量保障的要求。然而,考慮到電芯分容容量的預(yù)測誤差總和直接關(guān)系產(chǎn)線的經(jīng)濟(jì)效益,對電芯容量絕對值的預(yù)測精度仍有待提升。

圖2 RF模型(a)和CatBoost模型(b)預(yù)測結(jié)果的散點(diǎn)圖
通過獨(dú)立計(jì)算每個(gè)特征參數(shù)在模型計(jì)算過程中貢獻(xiàn)度大小得出的shap 值能夠體現(xiàn)特征參數(shù)對模型預(yù)測結(jié)果的影響程度。圖3 展示了RF 和CatBoost 兩種算法模型在對測試集預(yù)測效果達(dá)到最佳狀態(tài)時(shí),20 個(gè)特征參數(shù)shap 值的匯總結(jié)果。x軸表示每個(gè)數(shù)據(jù)對模型預(yù)測的影響大小,y軸按照各特征參數(shù)總體的貢獻(xiàn)作用,進(jìn)行了降序式排列,貢獻(xiàn)作用越大的特征參數(shù)排序越靠上。

圖3 20個(gè)特征參數(shù)對RF模型(a)和CatBoost模型(b)輸出結(jié)果影響的shap值匯總圖
首先,電芯質(zhì)量相關(guān)數(shù)據(jù)在兩類模型當(dāng)中均占據(jù)重要地位。在圖3(a)中的RF 模型的第二至第五個(gè)特征參數(shù)和圖3(b)中CatBoost 模型的第二、第四至第六個(gè)特征參數(shù)均與電芯質(zhì)量相關(guān),且都展示出積極的正向影響。這一結(jié)果和皮爾森相關(guān)性分析結(jié)果基本一致。與皮爾森相關(guān)性分析結(jié)果不同的是,OCV測試數(shù)據(jù)在兩個(gè)模型中均體現(xiàn)出較高貢獻(xiàn)作用,最直觀的結(jié)果是OCV2 電壓(第二次OCV檢測參數(shù))在兩個(gè)模型中的貢獻(xiàn)度大小都排在第一位。DCIR同樣顯示出較突出的作用,在兩個(gè)模型中分別被列為排序第七重要(RF 模型)和第三重要(CatBoost 模型)的特征。從結(jié)果來看,相比于RF 模型,化成溫度、化成截止電壓和DCIR三類參數(shù)在CatBoost 模型中表現(xiàn)出的影響力更強(qiáng)。根據(jù)一般性的科學(xué)認(rèn)知和技術(shù)經(jīng)驗(yàn),較高的化成溫度不僅有利于固體電解質(zhì)界面(SEI)生成反應(yīng),而且有利于隔膜被電解液充分浸潤;化成截止電壓越高,電解液越不穩(wěn)定,會有更多的活性鋰被界面副反應(yīng)消耗,導(dǎo)致鋰電池充放電容量降低;DCIR小的電池不僅大電流放電能力強(qiáng),實(shí)際容量發(fā)揮率也會更高。這些關(guān)鍵參數(shù)重要性的發(fā)揮可能是CatBoost 模型性能最佳的原因。機(jī)器學(xué)習(xí)模型分析的結(jié)果符合一般認(rèn)知和經(jīng)驗(yàn),證明高效率的建模分析方法可輔助提高科研人員對電芯生產(chǎn)機(jī)理的認(rèn)識水平,并再次印證了通過產(chǎn)線數(shù)據(jù)驅(qū)動機(jī)器學(xué)習(xí)建模實(shí)現(xiàn)鋰離子電池分容容量精準(zhǔn)預(yù)測的可行性。通過模型設(shè)計(jì)優(yōu)化,深入挖掘特征參數(shù)與分容容量之間的非線性關(guān)系是進(jìn)一步提高模型預(yù)測精度的關(guān)鍵。
鋰離子電池電芯的容量受各個(gè)生產(chǎn)環(huán)節(jié)綜合影響。本文證明了使用數(shù)據(jù)驅(qū)動的機(jī)器學(xué)習(xí)算法,建立主要工藝環(huán)節(jié)監(jiān)測數(shù)據(jù)與分容容量之間精準(zhǔn)映射關(guān)系的可行性。所使用的參數(shù)數(shù)據(jù)都是在實(shí)際的鋰電池生產(chǎn)線上采集的。基于2 萬余條產(chǎn)線數(shù)據(jù),采用四種不同的非線性機(jī)器學(xué)習(xí)算法進(jìn)行了模型訓(xùn)練和測試。采用RF 和CatBoost 算法建立的模型表現(xiàn)出較好的容量預(yù)測性能,它們的擬合度分別為0.618 6和0.620 6。測試集驗(yàn)證結(jié)果統(tǒng)計(jì)顯示,實(shí)際測量容量在108 Ah 以上的電池樣品被正確判斷為108 Ah 以上的概率最高達(dá)90.78%,預(yù)測誤差在540 mAh(標(biāo)準(zhǔn)容量的0.5%)以內(nèi)的電池樣品占比最高達(dá)88.47%。此外,通過分析模型中各特征參數(shù)貢獻(xiàn)度,發(fā)現(xiàn)了化成溫度、化成截止電壓、OCV和DCIR等參數(shù)與分容容量之間存在較為重要的關(guān)聯(lián)性。未來研究中,結(jié)合已有的科學(xué)認(rèn)知和生產(chǎn)經(jīng)驗(yàn),針對特征參數(shù)與分容容量之間非線性關(guān)系,進(jìn)一步優(yōu)化建模算法,提高容量預(yù)測精度,有望幫助生產(chǎn)企業(yè)提高產(chǎn)能、質(zhì)量保障能力和經(jīng)濟(jì)效益。