楊愛平 ,唐倩 ,撒利軍 ,劉達(dá)
(1.重慶大學(xué) 機(jī)械傳動國家重點(diǎn)實(shí)驗(yàn)室,重慶 400044;2.長安汽車有限責(zé)任公司,重慶 400023)
車輛在行駛過程中會產(chǎn)生大量熱量,對于傳統(tǒng)內(nèi)燃機(jī)汽車,熱量來自于動力總成中內(nèi)燃機(jī)缸體內(nèi)燃料的燃燒與零件的相對運(yùn)動,而對于電驅(qū)動的新能源汽車,熱量則來自于車輛內(nèi)鋰離子電池的產(chǎn)熱[1]。這些熱量若沒有及時被帶走,輕則造成車輛運(yùn)行穩(wěn)定性下降、燃油經(jīng)濟(jì)性降低,重則導(dǎo)致動力總成過熱報廢。現(xiàn)代車輛冷卻系統(tǒng)多傾向于使用成熟的液冷散熱,但液冷散熱系統(tǒng)存在大量的冷卻管路,需要保證其具有良好的密封性。在汽車的生產(chǎn)過程中,冷卻系統(tǒng)的密封性檢測是在冷卻液加注之前進(jìn)行的,具體方法是對冷卻系統(tǒng)進(jìn)行氣體加壓處理,通過一個保壓過程進(jìn)行密封性測試[2]。但這種方法工序復(fù)雜,并且測試要求的環(huán)境條件較高。隨著大數(shù)據(jù)科學(xué)的快速發(fā)展及汽車生產(chǎn)中全流程信息采集系統(tǒng)的廣泛應(yīng)用,已經(jīng)可以實(shí)現(xiàn)以低成本、大范圍、增量累計的方式獲取車輛生產(chǎn)過程中的有用信息[3],這為使用基于數(shù)據(jù)驅(qū)動的方法進(jìn)行動力總成冷卻系統(tǒng)密封性預(yù)測奠定了基礎(chǔ)。相比于傳統(tǒng)基于模型的方法,數(shù)據(jù)驅(qū)動的方法可以在沒有系統(tǒng)先驗(yàn)知識與準(zhǔn)確數(shù)學(xué)模型的基礎(chǔ)上,通過生產(chǎn)與測試過程中產(chǎn)生的大量有用信息訓(xùn)練AI模型,使其具備解決某一特定問題的能力[4]?;跀?shù)據(jù)的預(yù)測方法已經(jīng)取得了十分廣泛的應(yīng)用,胡杰等[5]基于車輛狀態(tài)參數(shù)、環(huán)境信息對電動車行駛里程進(jìn)行了預(yù)測,Lin Xie等[6]基于天然氣、石油行業(yè)安全儀表的操作數(shù)據(jù)預(yù)測了儀表的故障率。在車輛生產(chǎn)過程中,獲取生產(chǎn)數(shù)據(jù)是比較容易的,并且這些數(shù)據(jù)中往往蘊(yùn)含了大量與冷卻系統(tǒng)密封性有關(guān)的信息,因此使用基于數(shù)據(jù)的方法預(yù)測冷卻系統(tǒng)密封性是較為合適的。本文通過數(shù)據(jù)驅(qū)動的方法對動力總成密封性測試結(jié)果進(jìn)行預(yù)測,具體選擇了二分類的邏輯回歸判別模型。方案基于大量的生產(chǎn)過程工藝數(shù)據(jù)樣本,訓(xùn)練邏輯回歸模型,直至模型具備良好的輸出精度,最終實(shí)現(xiàn)對密封性測試結(jié)果的預(yù)測,本方案的具體流程如圖1所示。

圖1 方案流程圖
動力總成是車輛的核心部件,負(fù)責(zé)車輛動力的產(chǎn)生,決定了整車的動力性、經(jīng)濟(jì)性與可靠性[7]。對于傳統(tǒng)內(nèi)燃機(jī)車輛,動力總成包含發(fā)動機(jī)、變速器、進(jìn)氣系統(tǒng)、排氣系統(tǒng)、冷卻系統(tǒng)、供油系統(tǒng)、發(fā)動機(jī)懸掛等,而對于電驅(qū)動的新能源汽車,動力總成則包含整車動力驅(qū)動控制單元、電動機(jī)及其逆變器、變速器、冷卻系統(tǒng)等。雖然傳統(tǒng)汽車與新能源汽車動力總成在結(jié)構(gòu)上存在較大的區(qū)別,但均存在冷卻系統(tǒng),冷卻系統(tǒng)的運(yùn)轉(zhuǎn)情況將決定車輛行駛過程是否安全、穩(wěn)定。傳統(tǒng)內(nèi)燃機(jī)汽車的冷卻系統(tǒng)主要是為發(fā)動機(jī)缸體降溫,而新能源汽車?yán)鋮s系統(tǒng)則主要為電池系統(tǒng)降溫。車輛冷卻系統(tǒng)保證了動力總成在較高輸出功率的同時,又具有良好的經(jīng)濟(jì)性與可靠性。
現(xiàn)代車輛動力總成主要采用閉式強(qiáng)制循環(huán)冷卻系統(tǒng)[8],一般由冷卻水泵、水熱交換器、散熱器、循環(huán)管路等部分組成,屬于典型的液冷散熱方式。此外,在純電驅(qū)動汽車的冷卻系統(tǒng)中,還會采用風(fēng)冷、相變材料冷卻、熱管冷卻等冷卻方式,但由于液冷散熱效率高,其仍然為車輛動力總成主要冷卻方式。采用液體方式的冷卻系統(tǒng)中,由于冷卻管路中冷卻液存在較大壓力,因此普遍存在泄漏風(fēng)險,是本文主要研究的問題。液冷系統(tǒng)冷卻液泄漏會造成車輛散熱效率下降,若冷卻液滴落在動力總成中某些控制電路中,則會造成更為嚴(yán)重的損失。
為了使汽車在生產(chǎn)過程中能及時檢測到冷卻系統(tǒng)是否存在泄漏隱患,本文通過數(shù)據(jù)驅(qū)動的方式對冷卻管路進(jìn)行密封性預(yù)測,若預(yù)測模型判斷某一動力總成冷卻系統(tǒng)存在泄漏的風(fēng)險,則將該動力總成下線檢查,將安全隱患排除在產(chǎn)品交付之前。
數(shù)據(jù)驅(qū)動的預(yù)測模型依賴于大量的數(shù)據(jù)來訓(xùn)練模型,這些數(shù)據(jù)又分為訓(xùn)練集與測試集,統(tǒng)稱為數(shù)據(jù)集。訓(xùn)練集為訓(xùn)練模型的樣本數(shù)據(jù),測試集為模型訓(xùn)練好后評價模型的樣本數(shù)據(jù),由于測試集沒有參與模型訓(xùn)練,因此基于其的評價結(jié)果會更加客觀。本文的數(shù)據(jù)集來源于動力總成制造過程中產(chǎn)生的生產(chǎn)數(shù)據(jù),數(shù)據(jù)集中包含特征值與目標(biāo)值,特征值為輸入模型的數(shù)據(jù),目標(biāo)值為模型輸出的數(shù)據(jù),本文數(shù)據(jù)集中特征值為生產(chǎn)過程中冷卻管路各個螺栓的擰緊數(shù)據(jù),目標(biāo)值為對應(yīng)動力總成冷卻系統(tǒng)管路密封性測試是否合格的布爾值,其中測試合格情況與布爾值的具體對應(yīng)方式如表1所示,模型輸入輸出關(guān)系如圖2所示。

圖2 模型輸入輸出關(guān)系圖

表1 泄漏測試結(jié)果布爾值對應(yīng)表
對于已經(jīng)采集好的數(shù)據(jù),還需進(jìn)行預(yù)處理,包含缺失值處理、歸一化處理等。在使用機(jī)器學(xué)習(xí)等數(shù)據(jù)驅(qū)動的方法建模前,需要將訓(xùn)練數(shù)據(jù)集中異常的缺失值(如Null)進(jìn)行處理,本文采用的缺失值處理的方法為平均值插補(bǔ),具體策略為若某一樣本的某一數(shù)據(jù)存在缺失且缺失數(shù)據(jù)量較少,則結(jié)合多個樣本得到這一項(xiàng)的平均值,以平均值插補(bǔ)替換缺失值,若缺失數(shù)據(jù)量太多,則舍棄該樣本。除平均值插補(bǔ)法外,還有固定值插補(bǔ)法、最鄰近插補(bǔ)法,但由于這類方法對樣本誤差的影響較大[9],故沒有采用。缺失值處理能使模型需求的每個輸入值都存在,保證了模型穩(wěn)定性。
歸一化處理的目的是為了消除樣本之間的量綱影響,并加快模型訓(xùn)練時的收斂速度,本文使用z分?jǐn)?shù)(zscore)歸一化方法,該方法使所有處理后的數(shù)據(jù)樣本符合均值為0、標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布,歸一化處理的數(shù)據(jù)的計算公式為

式中:x為原始數(shù)據(jù);x*為歸一化處理的數(shù)據(jù);μ是樣本均值;σ是樣本標(biāo)準(zhǔn)差。
邏輯回歸(Logistic Regression)是一種廣義的線性回歸模型(Generalized linear model),是一種常用的統(tǒng)計學(xué)方法?;貧w一般指研究某一數(shù)學(xué)問題因變量與自變量之間的關(guān)系,而邏輯回歸往往是使用了Sigmoid函數(shù)的回歸模型。邏輯回歸在機(jī)器學(xué)習(xí)中屬于有監(jiān)督學(xué)習(xí),通過預(yù)測不同自變量發(fā)生某種情況的概率,從而求解某一分類或多分類問題的解,是一種經(jīng)典的分類問題預(yù)測方法。由于本文研究的動力總成冷卻系統(tǒng)密封性檢測是否合格的問題屬于二分類問題,故使用二分類的邏輯回歸模型進(jìn)行預(yù)測。
邏輯回歸的輸入函數(shù)h(X)為一線性函數(shù),它將所有螺栓的擰緊數(shù)據(jù)包含進(jìn)來,并使用權(quán)值系數(shù)將螺栓擰緊數(shù)據(jù)結(jié)合到一起,以便于后續(xù)的求解分析,輸入函數(shù)的具體形式為

式中:w0、w1、……、wn為各個權(quán)值系數(shù);x0、x1、……、xn為具體的螺栓擰緊數(shù)據(jù);b0、b1、……、bn為每一項(xiàng)的偏置系數(shù);W為權(quán)值系數(shù)集合;X為各螺栓擰緊數(shù)據(jù)集合。
在定義好邏輯回歸輸入函數(shù)后,引入Sigmoid函數(shù),其值域?yàn)閇0,1]。Sigmoid函數(shù)的具體數(shù)學(xué)形式見式(3),對應(yīng)的函數(shù)圖像如圖3所示。

圖3 Sigmoid函數(shù)圖像

由于本文需要預(yù)測的目標(biāo)為動力總成冷卻系統(tǒng)泄漏檢測是否合格,具體的檢測結(jié)果只有合格與不合格之分,前文已經(jīng)將測試結(jié)果與布爾值相對應(yīng),接下來應(yīng)該使其與條件概率聯(lián)系起來,使模型輸出測試合格與不合格條件下的概率值。為獲得二項(xiàng)邏輯回歸的條件概率模型,需將邏輯回歸輸入函數(shù)h(X)代入Sigmoid函數(shù)σ(i)中,使函數(shù)h(X)的輸出映射到值域?yàn)閇0,1]的區(qū)間中,式(4)、式(5)分別為泄漏測試合格(Y=1)與泄漏測試不合格(Y=0)條件下的條件概率分布函數(shù)。

在獲得條件概率分布函數(shù)后,需要將預(yù)測得到的條件概率劃分為具體的正例與反例以實(shí)現(xiàn)二分類,因此需要設(shè)定一個閾值s來區(qū)分正反例。本文設(shè)置的閾值s=0.5,當(dāng)P(Y=1|X)>0.5時,劃分為正例,模型預(yù)測結(jié)果為動力總成冷卻系統(tǒng)密封性檢測合格,當(dāng)P(Y=1|X)<0.5(即P(Y=0|X)>0.5)時,模型預(yù)測結(jié)果為動力總成冷卻系統(tǒng)密封性檢測不合格。
由于本文研究的是分類問題,因此通常使用混淆矩陣來評價模型預(yù)測能力?;煜仃囀且环N表示精度評價的標(biāo)準(zhǔn)格式,也稱為誤差矩陣,當(dāng)問題被分為n類時,往往由n行n列的矩陣構(gòu)成,二分類的混淆矩陣形式如表2所示?;煜仃囍?,TP(True Postive)表示真實(shí)結(jié)果與預(yù)測結(jié)果均為合格的樣本數(shù);TN(True Negative)表示真實(shí)結(jié)果與預(yù)測結(jié)果均不合格的樣本數(shù);FP(False Positive)屬于統(tǒng)計學(xué)第一類錯誤,表示將實(shí)際不合格的產(chǎn)品預(yù)測成合格產(chǎn)品;FN(False Negative)屬于統(tǒng)計學(xué)第二類錯誤,表示將實(shí)際合格的產(chǎn)品預(yù)測成不合格產(chǎn)品[10]。除混淆矩陣外,還有準(zhǔn)確率(Accuracy)、精確率(Precision)、正類正確率(True Positive Rate,TPR)、負(fù)類正確率(True Negative Rate,TNR)等評價指標(biāo),其計算公式如表3所示。

表2 二分類的混淆矩陣形式

表3 評價指標(biāo)計算公式
本文使用從某車企生產(chǎn)現(xiàn)場采集的218組動力總成歷史生產(chǎn)裝配數(shù)據(jù)用作訓(xùn)練模型,每組數(shù)據(jù)為一臺動力總成的與密封性有關(guān)的螺栓擰緊力與擰緊轉(zhuǎn)矩及最終密封性測試結(jié)果。實(shí)驗(yàn)平臺配置為處理器i5-9400f(2.90 GHz),內(nèi) 存 為16 GB,顯 卡 為NVIDIA GTX1660。實(shí)驗(yàn)使用Python編程語言并基于Pytorch機(jī)器學(xué)習(xí)庫構(gòu)建了邏輯回歸模型。
首先將數(shù)據(jù)集進(jìn)行缺失值處理與歸一化處理,保證數(shù)據(jù)完整且利于模型求解收斂。以7:3的比例將數(shù)據(jù)集劃分為訓(xùn)練集與測試集,分別設(shè)置邏輯回歸模型超參數(shù):學(xué)習(xí)率為0.01,分類閾值為0.5,正則化力度為0.01,迭代次數(shù)設(shè)置為200次,求解優(yōu)化器選擇隨機(jī)梯度下 降(stochastic gradient descent,SGD)。進(jìn)行求解運(yùn)算,得到200次迭代過程中訓(xùn)練集與測試集準(zhǔn)確率變化曲線如圖4、圖5所示。
由圖4與圖5可知,測試集的準(zhǔn)確率隨訓(xùn)練次數(shù)的增加而增加,且與訓(xùn)練集準(zhǔn)確率增長趨勢較為一致,說明本文所選的螺栓擰緊數(shù)據(jù)與密封性之間存在較大的關(guān)聯(lián)性,間接證明了方法的有效性。在訓(xùn)練次數(shù)到達(dá)100次時,模型開始學(xué)習(xí)到有價值信息并且開始收斂,在第100次到150次迭代過程中,訓(xùn)練集與測試集準(zhǔn)確率上升較快,150次迭代以后,訓(xùn)練集準(zhǔn)確率上升緩慢,測試集準(zhǔn)確率不再明顯上升并開始在85%之間波動,表現(xiàn)出過擬合現(xiàn)象,故訓(xùn)練停止。表4展示了動力總成密封性測試的部分實(shí)際測試結(jié)果與預(yù)測結(jié)果。

圖4 訓(xùn)練集準(zhǔn)確率

圖5 測試集準(zhǔn)確率
從表4可以看出,邏輯回歸模型對于動力總成密封性的預(yù)測擁有較高的準(zhǔn)確率,除2號樣本預(yù)測錯誤以外,其余樣本均預(yù)測正確。由于訓(xùn)練集參加了模型的訓(xùn)練過程,測試集的預(yù)測結(jié)果才能客觀體現(xiàn)模型的預(yù)測性能,為了驗(yàn)證模型對于測試集整體的預(yù)測能力,給出了測試集樣本預(yù)測結(jié)果的混淆矩陣如表5所示,模型分類能力評價指標(biāo)如表6所示。

表4 部分實(shí)際測試結(jié)果與預(yù)測結(jié)果

表6 模型分類能力評價指標(biāo)%
從表5的混淆矩陣中可得,測試集共66個樣本,只有7個樣本預(yù)測錯誤,其中包括2個統(tǒng)計學(xué)第一類錯誤的樣本,5個第二類錯誤樣本,模型將預(yù)測錯誤的樣本數(shù)控制在了較低的水平。由于本文最主要的目的是將密封性有問題的動力總成檢測出來,因此負(fù)類正確率(TNR)指標(biāo)尤為重要,模型基于測試集的負(fù)類正確率為88.23%,這表明10個問題樣本中會有接近9個被檢測出來。此外模型在其他指標(biāo)上也表現(xiàn)出較高的性能,其中準(zhǔn)確率(Accuracy)達(dá)到89.39%,精確率(Precision)為95.65%,正類正確率(TPR)為89.79%。以上數(shù)據(jù)表明,本文的邏輯回歸模型具有較高的預(yù)測能力,側(cè)面驗(yàn)證了本方案的有效性。

表5 預(yù)測結(jié)果與真實(shí)結(jié)果的混淆矩陣
本文基于數(shù)據(jù)驅(qū)動的邏輯回歸算法建立了對動力總成冷卻系統(tǒng)密封性質(zhì)量的分類判別模型。使用真實(shí)生產(chǎn)數(shù)據(jù)進(jìn)行實(shí)驗(yàn),得到的預(yù)測模型顯示出較高的精度,其中最重要的TPR指標(biāo)達(dá)到89.79%,表明不合格動力總成被檢測出來的概率較大,滿足了實(shí)際生產(chǎn)檢測需求。通過使用本文的預(yù)測模型,可以及時將生產(chǎn)過程中有問題的動力總成下線檢修,也可以對此后的人工密封性檢測結(jié)果提供參考,具有一定的工程意義。