劉海江,吳雨林
(同濟大學 機械與能源工程學院,上海 201804)
目前,國內自主研發的DCT[1]和國外先進產品相比,整體上存在不小的差距,尤其是在起步方面,會出現起步性能不穩定、起步響應慢、起步過程傳動系統抖動大、在某些惡劣行駛環境下汽車頻繁起步換擋造成離合器過熱甚至燒蝕等問題。而駕駛員在汽車行駛過程中起著決定性作用,知曉駕駛員起步意圖不僅能夠對駕駛員的駕駛行為和駕駛規律進行一定的預測,還能夠為后續研究DCT控制系統的智能化控制提供有利依據。因此,有必要準確辨識駕駛員的準確起步意圖,為DCT汽車的后續研制提供參考。
劉欣等[2]以模糊控制算法為基礎,提出一種利用單片機來表現駕駛員的起步意圖的方法,但這只是利用Matlab進行的仿真分析,沒有進行實車驗證,不能保證其能夠在實際駕駛情況中充分考慮駕駛員的起步意愿。DAI等[3]分析了油門踏板開度及其一階導數和二階導數對起步意圖的影響,并采用隱馬爾可夫模型(Hidden Markov Model,HMM)對起步意圖進行辨識,但是其識別準確率為80%,仍然有待提高。王姝等[4]基于前人經驗,將平路起步看作一段時間內駕駛員對油門踏板、制動踏板等的一系列動作的組合,并采用雙層HMM識別駕駛員的起步意圖。胡銳、陳勇[5]對純電動車起步過程進行動力學分析,基于模糊控制理論設計了駕駛員意圖雙模糊辨識系統,可以準確辨識出駕駛員起步意圖。但是,他們只考慮到了起步過程中駕駛員因為駕駛意愿對汽車施加的操作,并沒有考慮到車輛在起步過程中對駕駛員進行的反饋。LI Liang等[6]將加速踏板開度的統計規律作為輸入參數,提出了一種基于人工誤差反向傳播神經網絡的駕駛員起動意圖識別方法,識別正確率大于95%,但是其將整個起步過程意圖單一化,沒有考慮到駕駛員在起步過程中可能根據車輛反饋出現意圖的變化。
上述研究或是識別準確率不高,或是沒有充分考慮汽車起步時的駕駛員和汽車進行的雙向交互過程。針對以上問題,本文通過分析在平直道路起步過程中DCT車輛的人-車交互過程,得到表達駕駛員駕駛意愿的分析參數油門踏板開度,以及表達車輛對駕駛員反饋的分析參數縱向加速度;通過K均值聚類(K-means)對實車試驗得到的起步數據進行意圖劃分;通過主成分分析(Principal Component Analysis,PCA)法對所選取的特征值進行相關性分析,并進行降維得到新的主成分;最后構建基于支持向量機(Support Vector Machine,SVM)的起步意圖辨識模型,用來準確識別起步過程中駕駛員的起步意圖。
起步指的是駕駛員通過踩踏油門踏板等操作使汽車從完全靜止的狀態轉變為有一定速度的運動狀態的過程。駕駛員可以根據自身需求、路況和環境等進行不同程度的起步操作。根據專家的經驗,起步過程可以分為緩慢起步、一般起步和緊急起步[7-8]。緩慢起步指的是駕駛員緩慢輕踏油門踏板至某一較小開度,讓車輛的起步速度平緩增加,注重車輛起步的平順性;一般起步指的是駕駛員以正常速度踩踏油門踏板至一定的開度,對車輛的起步快慢和起步平順性均無特殊要求;緊急起步指的是駕駛員快速踩踏油門踏板至很大開度,讓汽車獲得盡可能大的起步加速度,追求汽車的快速起步而非平順性。
汽車起步過程是人-車交互的過程,駕駛員為實現初始的起步意圖對汽車施加一系列動作,之后再根據車輛的反饋而調整其意圖和動作,因此,有必要確定合理的意圖辨識周期。而有研究顯示[9],面對緊急情況時駕駛員的反應時間為0.2~0.4 s。因此,可以選擇0.4 s作為起步意圖的辨識周期,即將DCT汽車的起步過程以0.4 s為識別間隔劃分為6個時間段,在不同的時間段上分別進行3類起步意圖的界定。
汽車起步是一個信息交換和控制的過程,如圖1所示。根據相關研究[10],駕駛風格不同的駕駛員因相同的起步意圖踩踏油門踏板時,油門踏板開度相近,而因不同的起步意圖踩踏油門踏板時,油門踏板開度有明顯的差異。這說明駕駛員能夠通過踩踏油門踏板的速度和深度來表達其起步意愿,所以選擇油門踏板開度作為起步意圖的一個分析參數。根據文獻[11],駕駛員內耳的前庭器官相當于一個傳感器,可以感知到縱向加速度。這說明縱向加速度可以作為DCT汽車對于駕駛員操作的反饋,匹配駕駛員的主觀感受,所以選取縱向加速度作為起步意圖的分析參數。

圖1 汽車起步的信息交換和控制過程
本試驗與國內某主機廠合作,選擇符合GB/T 12534—1990《汽車道路試驗方法通則》要求的該主機廠1.5T-DCT汽車作為試驗用車。為了控制環境變量,且考慮到車輛起步一般為平路起步,所以試驗選擇在干燥、整潔的平直道路上進行。試驗采集設備包括分辨率為0.04905 m/s2的加速度測量設備和采樣頻率為100 Hz的數據采集系統。可以通過CAN總線和x/y軸加速度傳感器獲得油門踏板開度信號和縱向加速度信號。結合該主機廠專業駕駛員的駕駛評估經驗,分別以不同的踩踏速度將油門踏板踩到若干個指定的油門開度。進行多次重復試驗,得到140組起步試驗數據。
K均值聚類算法是一種迭代求解的算法,具有無監督、迭代速度快的特性[12],可以用于已知聚類簇數k值數據的劃分,因此選擇該方法界定駕駛員起步時的緩慢操作、一般操作和緊急操作。對于指定的k個簇,K均值聚類的優化目標是使所有簇內樣本的離差平方之和為最小,其優化目標如式(1)所示。

式中:x(u)為屬于第v個簇的樣本u;γ(v)為第v個簇的簇中心;nv為第v個簇的樣本總量。
而且本文所研究的起步意圖類別有3個,是已確定的,因此,在對試驗所得的140組起步試驗數據進行預處理,并以0.4 s為間隔分割完畢之后,分別選取每一個時間段內的油門踏板均值、縱向加速度均值作為特征值,利用K均值聚類算法對駕駛員的3種起步意圖界限值進行確定。以0~0.4 s內DCT汽車的起步數據為例,其聚類流程為:確定類別數目為k=3;選取初始聚類中心點(1.65, 0.46)、(34.88, 1.13)、(70.14, 0.65);分別計算其余樣本和這3個聚類中心點的距離,并根據各樣本與這3個聚類中心的最小距離確定其類別;重新計算3個簇中樣本的均值,并以均值作為新的聚類中心;在經過6次迭代之后,聚類中心變化穩定,從而得到最終的聚類中心(11.60, 0.24)、(33.82, 0.27)、(54.13,0.42)。其余時間段內的駕駛員起步意圖數據集劃分過程與之類似,不再贅述。
所有時間段的起步意圖聚類中心見表1,聚類結果如圖2所示。可以看出,不同起步意圖的聚類中心有較為顯著的差異,在各個時間段內相同起步意圖的特征點分布集中。在0~0.4 s內不同起步意圖之間的縱向加速度分布相近,但是依靠油門踏板開度的明顯差異,仍然能夠很好地區分這3種不同的起步意圖;0.4 s后隨著時間的推移,不同起步意圖間縱向加速度的分布差異也越來越明顯,綜合油門踏板開度和縱向加速度可以確定不同起步意圖的顯著界限。因此,基于K均值聚類對駕駛員的起步意圖進行劃分是合理的。

圖2 各時間段駕駛員起步意圖聚類結果

表1 各個時間段起步意圖最終聚類中心

PCA法[13]是一種將t個相關的原始特征p1,p2,....,pt經由線性變換組成新的互不相關的r個新特征Q1,Q2, ...,Qr的特征降維方法,可用如下模型表示:

式中:aij為主成分系數,(i= 1,2, … ,r;j= 1,2,… ,t)。
然而PCA的運用依賴于變量間的相關關系,因此,在進行PCA之前要進行相關性分析。KMO(Kaiser-Meyer-Olkin)檢驗統計量用于比較樣本相關系數和樣本偏相關系數,可以用來檢驗樣本是否適合進行PCA。它的取值在0~1之間,值越接近1,則說明樣本越適合進行PCA,一般要求該值大于0.5。巴特利特球形度檢驗(Bartlett’s Test of Sphericity)是一種檢驗各個變量之間相關性程度的檢驗方法,它的原假設是相關系數矩陣為單位矩陣,即原始變量互不相關。如果巴特利特球形檢驗的統計量較大,且其對應的相伴概率值小于用戶心中顯著性水平(一般認為小于0.05),那么就拒絕原假設,認為原始變量之間存在相關性,適合進行PCA。
石灰質量符合Ⅲ級以上標準,并在使用前7d進行充分消解。水泥采用32.5級復合硅酸鹽水泥,初凝時間不小于4h,終凝時間不小于6h。
由于縱向加速度油門和踏板開度在時間序列上都是變化的,為了反映在某段時間內的這兩個信號的穩態特征,選擇縱向加速度均值、平均油門踏板開度作為初始特征值。根據文獻[3]、文獻[8]、文獻[14]的研究,以油門踏板開度變化率作為特征值,可以反映出該時間段內油門踏板的動態特征,有效識別出駕駛員的駕駛意圖,所以選取油門踏板開度變化率作為一個初始特征值。根據文獻[15]的研究,不同駕駛意圖下的縱向加速度均方差有著顯著差異,所以選取縱向加速度均方差作為一個初始特征值。為了消除上述數據量綱、量級的差異,使之具有可比性,利用Z得分法(Z-score)進行標準化。以0~0.4 s的起步數據為例,將標準化后的縱向加速度均值(p1)、縱向加速度均方差(p2)、平均油門踏板開度(p3)、油門踏板開度變化率(p4)進行相關性分析,分析結果如表2和表3所示。其KMO取樣適切性量數為0.654,大于0.5,而Bartlett球形度檢驗的顯著性值小于0.001,說明這4個特征值之間存在著顯著的耦合關聯性,有產生較大的信息重疊,適合進行PCA。

表2 相關系數矩陣

表3 KMO和巴特利特球形度檢驗
選取主成分的原則是盡可能多地保留重要信息,而衡量信息的指標是主成分的方差,方差越大,說明其含有的主成分信息量越大[17]。第k個主成分的方差貢獻率為:

式中:μk為相關系數矩陣的特征值,k= 1, 2,…,t,且μ1>μ2> … >μt。其中特征值μk對應的單位特征向量為αk=(αk1,αk2, ...,αkt)。
根據特征值的累計方差貢獻率來確定主成分個數r。按照經驗,通常取累計方差貢獻率大于或等于85%[16]。前m個主成分的累積方差貢獻率為:

對0~0.4 s起步數據進行主成分分析后,得到的分析結果見表4。由表4可知,第1主成分累積方差貢獻率為71.71%,小于85%,而第1主成分和第2主成分的累積方差貢獻率達到92.73%,大于85%,所以可以確定主成分的個數為2。新主成分的表達式為:

表4 PCA分析結果

第1個主成分Q1能代表縱向加速度均值p1、縱向加速度均方差p2、油門踏板開度變化率p4的信息,而第2個主成分Q1能代表平均油門踏板開度p3的信息。將特征值所對應的單位特征向量作為主成分模型中的權重系數,排除人為干預帶來的主觀誤差,這兩個主成分可作為之后用于起步意圖識別模型的新特征值。
SVM作為一種有監督的學習算法,通過將低維線性不可分空間轉變為高維線性可分空間,從而擁有較高的預測準確率。對所劃分的每個時間段內都分別建立1個SVM模型,進行該時間段內的駕駛員起步意圖識別。SVM算法的分類原理如下[18]:
對于線性可分的SVM,假設訓練樣本是(uk,vk),k=1, 2,…,N,v∈{-1 ,1},存在某分割超平面αTu+β=0將正負樣本點進行區分,使不同類型的樣本分布在該超平面的不同側,此時形成距離為的“分割帶”,使|αTuk+β|=1的樣本點與該超平面的距離達到最小。考慮到本研究中設計的樣本可能為非線性可分,即無法通過某線性超平面直接對樣本點進行分割,必須通過某種變換φ(u)將其映射到高維空間中,于是引入松弛因子ξ和懲罰系數C修正優化目標和約束。采用拉格朗日(Lagrange)對偶性可以將該最優化問題等價轉換:

式中:γk,γl為 Lagrange 系數。
最終可獲得最優分類函數,如式(7)所示。

最優分類函數也可轉化為:

SVM模型的性能主要取決于懲罰系數C和核函數K。越大的懲罰系數會使“分割帶”帶寬越小,雖然提高了訓練集上樣本的正確分類個數,卻可能導致模型過擬合;而懲罰系數過小會造成模型欠擬合。改變核函數的形式和它的參數會隱式地改變樣本點從原始空間到高維空間的映射,在實際應用中,采用不同的核函數將導致出現不同的SVM算法。本研究基于專家經驗知識,分別列舉出多個懲罰系數C以及各個常用核函數K參數可能的取值,采用網格搜索法,對其進行排列組合,并將所有的組合結果生成“網格”;然后利用5折交叉驗證,將起步數據集的訓練集平均分成5份,其中4份為學習集,第5份為驗證集,對所有“網格”進行評估,重復5次,從而確定最佳的懲罰系數C、核函數K以及該核函數的參數,結果見表5。

表5 SVM模型的參數選擇
綜上所述,基于PCA-SVM的起步意圖識別流程如圖3所示。首先設計并進行DCT汽車起步試驗,獲得所需要的起步數據集;在對測試參數進行缺失值處理、異常值剔除、去噪等預處理后,利用K均值聚類對各時間段內的起步意圖進行界定;然后基于PCA確定新的特征值用于之后起步意圖的識別;最后將起步數據集劃分成訓練集和測試集,利用訓練集獲得基于SVM的起步意圖識別模型的懲罰系數和核函數,利用測試集對所訓練出的模型性能進行驗證。

圖3 基于PCA-SVM的起步意圖識別流程
基于K均值聚類得到的各時間段內不同起步意圖的樣本數量見表6,單個起步樣本包含經由K均值聚類得到的意圖標簽和經由PCA后得到的新特征值。采用留出法,按照3∶1將這6個時間段內的起步數據集劃分為訓練樣本集和測試樣本集;利用Python軟件,根據訓練樣本集分別完成6個SVM模型的訓練;將測試樣本集送入訓練好的SVM進行起步意圖識別,并與原本的意圖標簽進行對比以檢驗模型的識別效果。以此得到的駕駛員起步意圖識別結果混淆矩陣如圖4所示,圖中1代表緩慢起步,2代表一般起步,3代表緊急起步。

圖4 起步意圖識別結果混淆矩陣

表6 各時間段內不同起步意圖樣本數量

能夠正確識別出駕駛員的真實起步意圖是DCT控制系統智能化的基礎,因此,選取準確率和命中率作為評估該起步意圖識別模型性能的指標。其中,準確率為識別正確的樣本數占所有樣本數的百分比;命中率為每類樣本中識別正確的樣本數與該類別樣本數目的比值。計算不同起步階段不同起步意圖下的準確率和命中率,結果見表7。由表可知,這6個PCA-SVM模型的識別準確率均在90%以上,且平均識別準確率也高達94.92%;而只用線性SVM模型分別對這6個時間段的起步意圖進行識別時,其識別準確率分別為62.86%、91.43%、91.43%、65.71%、82.46%、74.29%,平均識別準確率為78.03%,小于PCA-SVM模型的識別準確率,如圖5和圖6所示。而且,這6個PCA-SVM識別模型中對緩慢起步的識別命中率最高,均在90%以上;而對于一般起步和緊急起步的識別,最低的識別命中率也在85%以上,平均命中率分別為94.36%和89.74%。這表明了基于PCA-SVM的起步意圖識別模型具有很高的識別準確率和命中率,泛化性能好。由表8可知,PCA-SVM模型和SVM模型的單個片段起步意圖識別時間分別為0.008 s和0.002 s,均小于通常情況下駕駛員面對危急情形時的反應時間0.2~0.4 s,因此,PCA-SVM模型具有較好的實時性。

圖5 線性SVM模型和PCA-SVM模型的識別準確率對比

圖6 PCA-SVM模型與線性SVM模型識別準確率之差

表7 PCA-SVM模型的識別準確率和命中率

表8 PCA-SVM模型與線性SVM辨識時間對比
本文提出了一種基于PCA-SVM模型的DCT汽車駕駛員起步意圖識別方法,與其他起步意圖識別方法相比,該方法不僅關注駕駛員起步意圖的動態變化,而且識別效果較好,結論如下:
(1)在起步過程中,綜合駕駛員的主觀感受和DCT汽車的起步響應,將起步過程以0.4 s為間隔劃分為6個時間段,充分考慮了駕駛員起步意圖的變化。
(2)采用K均值聚類算法對DCT汽車駕駛員在各個時間段內的緩慢、一般和緊急操作進行了界定,得到具有明顯差異性的3類不同的起步意圖。
(3)針對原有特征值相關性較高的問題,提出了采用PCA進行降維的方法,得到新的特征值。
(4)構建了6個PCA-SVM模型,用作DCT汽車各個階段起步意圖的識別,其平均識別準確率達到94.92%,各起步意圖的最低識別命中率也在85%以上,而且其模型單個片段的平均識別時間為0.008 s,實時性能良好。