田 毅 張 欣 張 昕 張 良
1.裝甲兵工程學院,北京,100072 2.北京交通大學,北京,100044 3.酒泉衛星發射中心鐵路管理處,酒泉,732750
混合動力電動汽車(HEV)被認為是21世紀解決汽車面臨的石油能源危機和環境污染問題的有效方案之一,建立先進合理的能量管理控制策略以及對現有控制策略進行優化已成為國內外各研究機構探索的核心技術之一。混合動力電動汽車的控制策略與汽車運行狀態緊密相聯,在對控制策略進行優化的過程中,運行工況不同,其優化結果也不同,而且車輛實際行駛過程中所經歷的隨機狀態與已制定的典型運行工況也會有所差異?;谶\行狀態識別的智能控制策略是最新提出的HEV控制策略,它通過對汽車當前的運行狀態進行識別來調整整車控制策略,使得HEV能夠適應于不同的運行狀態[1-6]。
2002年,Lin等[1]采用10個參數建立了基于Hamming神經網絡的汽車運行狀態識別模型,對美國和韓國的6種典型運行工況進行了識別。2005年,Langari等[2]采用Ericsson定義的26個參數,建立了基于學習向量量化(LVQ)神經網絡的汽車運行狀態識別模型,對美國LOS的運行工況進行識別。在我國,羅玉濤等[3]采用“工況塊”的概念,用工況的平均行駛車速和行駛距離作為特征參數,通過模糊分類器對汽車運行狀態進行了識別。周楠等[4]采用循環平均車速、循環行駛平均車速等10個參數,建立了基于簡單神經網絡的汽車運行狀態識別模型,對北京、紐約、長春、上海等地的汽車運行工況進行了識別。張良等[5]采用18個參數,建立了基于支持向量機(SVM)的汽車運行狀態識別模型,對我國上海和廣州市的汽車運行工況進行了識別。田毅等[6]采用13個參數,建立了基于模糊神經網絡的汽車運行狀態識別模型,對不同敏感性參數的汽車運行工況進行了識別。
對汽車運行狀態識別算法進行研究發現,想要得到一個高性能的汽車運行狀態識別模型,必須首先得到一個汽車運行狀態特征參數最優子集。實際上,目前在特征參數選擇的算法中,不論是基于Wrapper框架的,還是基于Filter框架的,都是針對確定的特征參數全集進行選擇計算的。而在對汽車運行狀態特征參數進行分析后發現,其中的分段參數部分的運行狀態特征參數之間的邊界是不確定的,不同研究人員定義的特征參數之間的邊界也是不一樣的,因此特征參數全集也是不一樣的,對于這種特征參數選擇問題目前還鮮有人進行研究。
本文建立了一種基于混合搜索的汽車運行狀態特征參數選擇方法,有效地把自適應遺傳算法和浮動搜索算法的優勢進行結合,順利解決了汽車運行狀態特征參數選擇問題。
汽車運行狀態識別是一種在線識別,因此必須保證識別模型的準確性和實時性。本文中采用一組共22個特征參數作為汽車運行狀態特征參數全集,如表1所示,可分為標準參數、波動參數、分段參數[7]三部分。表中,v1、v2、v3為有關車速的特征參數之間的邊界,km/h;r1、r2為有關減速度的特征參數之間的邊界,m/s2;a1、a2為有關加速度的特征參數之間的邊界,m/s2。
相對加速度aRPA的計算公式為[7]

式中,v為車速,m/s;a為汽車加速度,m/s2;t為汽車運行時間,s。
汽車運行狀態特征參數中分段參數部分是對汽車車速曲線變化規律的一種定性分析,研究人員可以根據自己的需要對分段參數部分的特征參數之間 的 邊 界v1、v2、v3、r1、r2、a1、a2定 義 不 同 的 數值。在汽車運行狀態特征參數選擇時,需要對特征參數之間的邊界進行優化,從而計算得到最優的特征參數全集,因此不能采用現有的特征參數選擇方法進行汽車運行狀態特征參數的選擇計算,需要建立新的算法來解決這種特征參數選擇問題。

表1 樣本參數表
測試數據集是評價特征參數子集優劣的基礎,其結果直接影響到識別模型的準確性及泛化能力。在建立汽車運行狀態識別所需的車輛運行工況測試數據集時,需要首先對汽車運行狀態進行分析,確定其分類類別。通過查閱我國《城市道路設計規范》、城市典型運行工況制定等相關文獻后,發現快速路和主干道是我國大多數城市的主要交通路線。本文選用北京、上海、廣州和武漢作為我國城市的代表。另外,為了增加測試數據集的覆蓋面,提高汽車運行狀態識別模型的識別準確性和泛化能力,本文還采用GPS車速采集儀,對汽車在主干道和快速路上的實際運行車速進行了采集,采集結果如圖1所示。

圖1 車速采集
考慮到汽車在行駛過程中車速是一個時變量,汽車車速隨著時間的變化而變化。為了提高識別模型的實時性,本文采用滾動時間窗的方式對速度-時間曲線進行分割[6],在此基礎上建立汽車運行狀態特征參數選擇所需的測試數據集。通過計算這些速度小片段的汽車運行狀態特征參數,可以得到汽車運行狀態的測試數據集,其中包括7784組數據的主干道測試數據集和5805組數據的快速路測試數據集。然后分別從主干道和快速路測試數據集中隨機選擇200個樣本作為運行狀態分類器的訓練數據集。
采用計算得到的汽車運行狀態特征參數全集和測試數據集,對汽車運行狀態特征參數選擇進行分析,發現其具有兩個特點:
(1)汽車運行狀態特征參數之間的邊界v1、v2、v3、r1、r2、a1、a2不確定,需要對邊界進行優化,才能計算得到最優的特征參數全集。因此不能采用現有的特征參數選擇方法進行汽車運行狀態特征參數的選擇計算。
(2)如果運行狀態特征之間的邊界得到確定,則屬于中小規模特征全集的特征參數選擇問題,即全集χ中僅有22個參數,完全可以采用現有的特征參數選擇方法進行求解。
因此在進行汽車運行狀態特征參數選擇時,采用以下步驟:確定輸入參數之間的邊界v1、v2、v3、r1、r2、a1、a2,計算特征參數全集;對于任意一組特征參數之間的邊界,都可以得到一個特征參數全集χ。識別準確度的計算公式為

式中,Racc為識別準確度;k為測試數據集K中數據的個數;Y′=φs(Sw)為分類器的預報值;Sw為汽車運行狀態特征參數子集。
當Racc最大,Sw中特征參數個數最少時,當前的Sw就是汽車運行狀態特征參數的最優子集。
通過對汽車運行狀態特征參數選擇對象進行研究,發現主要有兩種搜索對象,一種為對特征參數邊界進行搜索,另外一種為對特征參數子集進行搜索。因此本文針對這兩種搜索對象,采用內外兩層循環的方式,對汽車運行狀態特征參數進行選擇。
(1)外層循環的主要任務是尋找最優的汽車運行狀態特征參數之間的邊界,以便生成特征參數全集,也可以認為是特征參數選擇問題的全局搜索操作。對汽車運行狀態特征參數之間的邊界進行搜索尋優是一個多參數多目標優化問題,因此需要選擇智能搜索算法。常用的智能搜索算法為遺傳算法、蟻群算法、模擬退火算法等。本文中選用自適應遺傳算法[8-9]作為外層循環的搜索方式。
(2)內層循環的主要任務是對外層循環得到的汽車運行狀態特征參數全集進行特征參數選擇計算,也可以認為是汽車運行狀態特征參數選擇問題的局部搜索操作。
在汽車運行狀態特征參數選擇過程中,如果內層循環也采用遺傳算法進行特征參數選擇,則計算時間過長,也容易產生局部最優解,而且遺傳算法對于中小規模數據集的特征參數選擇來說并不具有優勢。為了盡量縮短特征參數選擇的搜索時間,本文選用了對中小規模數據集搜索能力強的浮動搜索算法作為內層循環的搜索算法。
汽車運行狀態特征參數邊界的優化模型主要包括:優化參數、約束條件和目標函數。
(1)優化參數。根據1.1中的分析得到,運行狀態特征參數之間的邊界v1、v2、v3、r1、r2、a1、a2是不確定的,因此本文將這些參數作為自適應遺傳算法的優化參數。
(2)約束條件。本文對運行狀態特征參數邊界,即優化變量v1、v2、v3、r1、r2、a1、a2的約束區間上下限根據經驗確定,如表2所示。

表2 優化變量的約束區間
(3)目標函數。本文采用加權法建立遺傳算法中的目標函數,從而將多目標優化問題轉化為單目標優化問題。在汽車運行狀態特征選擇問題中,遺傳算法的目標函數為

式中,f1為遺傳算法的目標函數值;WA為分類器識別準確度的權重;Nsw為特征參數子集中參數個數;WF為特征參數子集中參數個數的權重。
考慮到Racc和Nsw數量級的不同,本文中定義WA=0.99,WF=0.01。
在遺傳算法計算過程中,通過選擇、雜交和變異三種基本形式,模擬自然選擇以及遺傳過程中的繁殖、雜交和突變現象。然而如果對于無論適應度高的個體還是適應度低的個體都以同樣的概率進行交叉和變異操作,顯然是不合理的。本文采用自適應的遺傳算法進行計算,該算法對適應度高的個體采用較小的概率進行交叉和變異操作,對適應度低的個體采用固定的概率進行交叉和變異操作[9]。
(1)選擇操作。本文中采用輪盤賭模型,按各染色體適應度大小比例來決定其被選擇數目的多少。
(2)交叉操作。交叉概率公式為

式中,fi為待交叉的兩個個體中適應度較高者的適應度;favg為當前種群中所有個體的平均適應度;fbest為當前種群中適應度最高的個體適應度。
(3)變異操作。交異概率公式為

傳統浮動搜索算法的起始點往往采用隨機生成的方式[10-11]。因此如果采用傳統的浮動搜索算法,混合搜索算法中每次進行浮動搜索計算所選的起始點之間沒有任何關系,是相互獨立的。通過對采用遺傳算法得出的汽車運行工況特征參數全集進行分析后發現,這些特征參數全集之間具有一定的類似性,因此本文提出了起始點種群間遺傳和個體間遺傳兩種選擇浮動搜索算法起始點的方法。
(1)基于起始點種群間遺傳的混合搜索算法。在遺傳算法每個種群中所有個體計算完以后,對計算得到候選特征參數子集進行評價,得到相對最優的子集并遺傳給下一代。當新的種群生成后進行浮動搜索時,選用的起始點就是上一個種群計算得到的最優子集。
(2)基于起始點個體間遺傳的混合搜索算法。在遺傳算法每個個體計算完后,就進行一次最優子集評價,如果比原先的最優子集好,則替代,并遺傳給下次搜索;如果不好,則放棄。當新的個體進行計算時,起始點就選從當前的最優子集開始搜索。采用起始點個體間遺傳的混合搜索算法對汽車運行狀態特征參數進行選擇的流程如圖2所示。

圖2 采用起始點個體間遺傳的混合搜索算法流程圖


表3 遺傳算法優化后的特征參數之間的邊界

采用基于向后搜索的特征參數選擇方法,對優化后的汽車運行特征參數全集進行搜索,分類器的識別準確度隨特征參數個數的變化如圖3所示。從圖中可以得到,特征參數最優子集中參數數目在8~12時,分類器的識別準確度相差很小。而且,分類器的識別準確度隨著最優子集中特征參數個數的減少,先增加后減少。主要是因為:特征參數過多時,不重要的特征參數會對分類器造成干擾,影響分類器的識別準確度;當特征參數減少到一定程度時,分類器的識別準確度保持不變;隨著特征參數進一步減少,當其不能完全反映汽車運行狀態的特征時,減少特征參數個數會造成特征的缺失,從而導致分類器的識別準確度大幅度降低。

圖3 特征參數子集個數與分類器識別準確度的關系
對浮動搜索算法的起始點,分別采用起始點獨立、起始點種群間遺傳和起始點個體間遺傳三種方式對汽車運行狀態特征參數進行選擇,計算結果如表4所示。

表4 采用不同起始點位置的浮動搜索算法的計算結果
從表4中可以得到,浮動搜索算法的起始點采用種群間遺傳或個體間遺傳的方式得到了相同的特征參數最優子集,而且比采用起始點獨立方式計算得到的結果更好。分析原因主要是因為混合搜索算法中浮動搜索采用起始點獨立的方式,沒有充分利用到每次搜索得到的特征參數最優子集的優勢,起始點不是最優點,使得計算結果容易陷入局部最優。相對于采用起始點獨立的方式,采用個體間遺傳的方式,可以使得搜索時間縮短45%,汽車運行狀態特征參數最優子集個數從11個降低到8個,采用特征參數最優子集訓練得到的分類器識別準確度也有所提高。在汽車運行狀態特征參數選擇計算過程中,起始點采用個體間遺傳的方式比采用種群間遺傳的方式的計算時間更短,原因是采用個體間遺傳的方式雖然增加了評價特征參數子集優劣的時間,但是浮動搜索的起始點更加優秀,最大程度地避免了無效搜索,縮短了搜索的時間。
不同起始點位置的浮動搜索算法計算得到的最優子集中特征參數個數隨進化代數的變化曲線如圖4所示,由圖4a可以得到,特征參數個數雖然總體上隨著進化代數的增加而減少,但是由于沒有充分利用每次搜索得到的特征參數最優子集的優勢,使得計算結果很容易脫離最優區域,搜索初期會出現特征參數偶爾增加的情況,而且最終的結果也不是最優解,只能得到11個參數的特征參數最優子集。起始點個體間遺傳的搜索效率最高,當進化代數達到31代時就得到了最優解,比起始點種群間遺傳要快6代,而且得到了8個參數的特征參數最優子集。

圖4 特征參數個數隨進化代數的變化曲線
為了解決汽車運行狀態特征參數選擇問題,本文提出了一種混合搜索算法。該算法將自適應遺傳算法和浮動搜索算法相結合,通過自適應遺傳算法對汽車運行狀態特征參數之間的邊界進行搜索,依據獲得的邊界得出汽車運行狀態特征參數全集特征;在此基礎上,以浮動搜索算法對全集參數進行搜索,進而選擇出汽車運行狀態特征參數最優子集。
本文中還對最優子集中參數數量進行了分析,得到最優子集的識別準確度會隨著參數個數的減少先增大后減小的結論。另外,通過計算說明浮動搜索算法的起始點采用個體間遺傳的方式,相對于采用傳統的起始點獨立的方式,可以使得汽車運行狀態特征參數最優子集中參數個數從11個減少到8個,并可提高搜索效率和最優子集的識別準確度。
[1]Lin C,Jeon S,Peng H,et al.Driving Pattern Recognition for Control of Hybrid Electric Trucks[J].Vehicle System Dynamics,2004,42(1/2):41-57.
[2]Langari R,Won J S.Intelligent Energy Management Agent for a Parallel Hybrid Vehicle—Part I:System Architecture and Design of the Driving Situation Identification Process[C]//IEEE Transaxtions on Vehicular Technology.USA:IEEE,2005:925-935.
[3]羅玉濤,胡紅斐,沈繼軍.混合動力電動汽車行駛工況分析與識別[J].華南理工大學學報(自然科學版),2007,35(6):8-13.Luo Yutao,Hu Hongfei,Shen Jijun.Analysis and Recognition of Running Cycles of Hybrid Electric Vehicle[J].Journal of South China University of Technology(Natural Science Edition),2007,35(6):8-13.
[4]周楠,王慶年,曾小華.基于工況識別的HEV自適應能量管理算法[J].湖南大學學報(自然科學版),2009,36(9):37-41.
Zhou Nan,Wang Qingnian,Zeng Xiaohua.Adaptive HEV Energy Managemen Algorithms Based on Drive-cycle Recognition[J].Journal of Hunan University(Natural Sciences),2009,36(9):37-41.
[5]Zhang Liang,Zhang Xin,Tian Yi,et al.Intelligent Energy Management for Parallel HEV Based on Driving Cycle Identification using SVM[C]//The Institution of Engineering and Technology,Proceedings of the 2009 International Workshop on Information Security and Application.Oulu:IWISA,2009:457-460.
[6]田毅,張欣,張昕,等.基于神經網絡工況識別的HEV模糊控制策略[J].控制理論與應用,2011,28(3):363-369.
Tian Yi,Zhang Xin,Zhang Xin,et al.HEV Fuzzy Control Strategy Based on the Neural Network Identification of Driving Cycle[J].Control Theory& Applications,2011,28(3):363-369.
[7]Ericsson E.Independent Driving Pattern Factors and Their Influence on Fuel-use and Exhaust Emission Factors[J].Transportation Research Part D,2001,6(4):325-345.
[8]魏志成.基于遺傳算法的魯棒數字圖像水印研究[D].天津:天津大學,2007.
[9]曾喻江.基于遺傳算法的衛星星座設計[D].武漢:華中科技大學,2007.
[10]Somol P,Pudil P,Novovicova J,et al.Adaptive Floating Search Methods in Feature Selection[J].Pattern Recognition Letters,1999,20(3):1157-1163.
[11]Songyot N,David P C.An Improvement on Floating Search Algorithms for Feature Subset Selection[J].Pattern Recognition,2009,42(4):1932-1940.