李景熹,蔣鐵軍
(1.海軍裝備部 艦船辦,北京 100071;2.海軍工程大學(xué)裝備經(jīng)濟(jì)管理系,湖北 武漢 430033)
基于特征加權(quán)支持向量機(jī)的武器系統(tǒng)效能評(píng)定方法
李景熹1,蔣鐵軍2
(1.海軍裝備部 艦船辦,北京 100071;2.海軍工程大學(xué)裝備經(jīng)濟(jì)管理系,湖北 武漢 430033)
針對(duì)武器系統(tǒng)效能綜合評(píng)定的任務(wù)需求,同時(shí)考慮到傳統(tǒng)特征選擇方法的不足,提出采用一種監(jiān)督型封裝模式的加權(quán)特征選擇方法用于武器系統(tǒng)的效能評(píng)定,能有效區(qū)分不同特征對(duì)效能的影響程度。鑒于支持向量機(jī)的良好應(yīng)用效果以及混合核函數(shù)的優(yōu)良性能,采用基于混合核函數(shù)的支持向量機(jī)建立特征與效能之間的關(guān)系模型。考慮到特征選擇和評(píng)估模型建立的目標(biāo)一致性,提出一種基于粒子群優(yōu)化算法的聯(lián)合優(yōu)化方法,同時(shí)實(shí)現(xiàn)特征的影響程度分析和效能評(píng)估模型的優(yōu)化。最后以導(dǎo)彈系統(tǒng)的效能評(píng)定問題為背景開展應(yīng)用分析,實(shí)際計(jì)算表明所提出方法的有效性。
效能評(píng)定;加權(quán)特征選擇;支持向量機(jī);混合核函數(shù);粒子群優(yōu)化算法
在武器系統(tǒng)的研制、試驗(yàn)、采購、使用及維修等各個(gè)階段,其效能的綜合評(píng)定都顯得十分重要,是武器系統(tǒng)管理必不可少的有效工具。
對(duì)于武器系統(tǒng)的效能評(píng)定,目前有許多方法可供采用,如專家評(píng)定法、試驗(yàn)統(tǒng)計(jì)法、作戰(zhàn)模擬法、指數(shù)法、解析法、參數(shù)效能法等[1]。其中,指數(shù)法和參數(shù)效能法通過建立效能和各項(xiàng)指標(biāo)之間的關(guān)系式對(duì)效能進(jìn)行評(píng)定。通過關(guān)系式的建立,一方面能夠?qū)崿F(xiàn)對(duì)武器系統(tǒng)效能的綜合評(píng)定,另一方面還能夠確定各項(xiàng)指標(biāo)對(duì)效能的影響程度,這一點(diǎn)對(duì)于獲取提升武器系統(tǒng)效能的方案尤為重要;同時(shí),這類方法還具有結(jié)構(gòu)簡單、使用方便的特點(diǎn),因此,在實(shí)踐中得到了廣泛的應(yīng)用。
一般來說,為避免信息的丟失,在建立戰(zhàn)術(shù)技術(shù)指標(biāo)與效能之間的關(guān)系時(shí),通常會(huì)盡可能多地收集影響效能的戰(zhàn)技指標(biāo)或稱為特征參數(shù)。但在很多情況下,影響系統(tǒng)效能的特征參數(shù)是很多的。例如對(duì)于導(dǎo)彈系統(tǒng)而言,可能涉及到的影響因素包括發(fā)射重量G0、導(dǎo)彈長度L、導(dǎo)彈翼展長度E、導(dǎo)彈的最大飛行速度Mmax、最大射高Hmax、導(dǎo)彈最大直徑dmax、戰(zhàn)斗部重量Gz、最大射程Rmax和殺傷概率P等[2]。針對(duì)這種情況建立模型時(shí),引入無關(guān)特征往往會(huì)降低關(guān)系式的推廣應(yīng)用效果,同時(shí)也給收集數(shù)據(jù)帶來困難,當(dāng)樣本量比較小時(shí) (如武器系統(tǒng)領(lǐng)域)尤為突出。因此,需要在建立評(píng)估模型前對(duì)特征進(jìn)行篩選,一方面得到效果比較好的效能評(píng)估模型,另一方面實(shí)現(xiàn)對(duì)指標(biāo)重要性的判別。
通常用于將多個(gè)指標(biāo)化為少數(shù)指標(biāo)的方法有主成分分析和Rough集等。主成分分析通過對(duì)原始指標(biāo)集進(jìn)行空間轉(zhuǎn)換實(shí)現(xiàn)指標(biāo)的綜合,但是通常比較適合指標(biāo)間相互獨(dú)立或呈線性關(guān)系的情況,而且提取得到的主成分通常不具有明確的物理意義,不便于后續(xù)的分析;Rough集能夠?qū)?zhàn)術(shù)技術(shù)指標(biāo)進(jìn)行有效篩選,但是需要制定閾值對(duì)各項(xiàng)指標(biāo)進(jìn)行簡約,而且對(duì)指標(biāo)集的簡約或多或少會(huì)存在信息的損失[3]。
本文提出一種基于監(jiān)督型封裝模式的加權(quán)特征選擇方法,用于武器系統(tǒng)效能的綜合評(píng)定,通過加權(quán),可以更加細(xì)致地區(qū)分特征對(duì)評(píng)估性能的影響情況以提高評(píng)估模型的效果,進(jìn)而有效解決效能的綜合評(píng)定問題。
監(jiān)督型的特征選擇方法一般分為過濾模式和封裝模式2種,如圖1所示。
1)過濾模式。在過濾模式中,特征選擇只是作為一種預(yù)處理手段,分析對(duì)象是候選特征子集及其數(shù)據(jù),它不直接優(yōu)化任何特定的預(yù)測模型。特征選擇的過程與模型建立的過程無關(guān),它們獨(dú)立分步地完成。
2)封裝模式。在封裝模式中,選擇方法在進(jìn)行初步的特征選擇以后,還要通過這些特征建立評(píng)定模型,根據(jù)其評(píng)定的效果對(duì)選擇的特征子集實(shí)施評(píng)估。封裝模式把特征選擇看作是在所建立的評(píng)價(jià)準(zhǔn)則下對(duì)特征空間中所有可能的組合進(jìn)行搜索的問題[4]。

圖1 特征選擇中的過濾模式和封裝模式Fig.1 Filtermode and wrappermode in feature selection
支持向量機(jī) (support vector machine,SVM)是一種基于統(tǒng)計(jì)學(xué)習(xí)理論和核技術(shù)而建立的新型機(jī)器學(xué)習(xí)方法,由于其對(duì)小樣本問題的適應(yīng)能力及良好的泛化推廣性能,已經(jīng)得到較為廣泛的應(yīng)用[5-8]。
本文采用SVM描述戰(zhàn)術(shù)技術(shù)指標(biāo)與效能之間的關(guān)系,建立武器系統(tǒng)效能評(píng)估模型;同時(shí),考慮到核函數(shù)對(duì)SVM模型性能的重要性,選取應(yīng)用效果較好的混合核函數(shù)作為SVM的核函數(shù),并與RBF核以及多項(xiàng)式核進(jìn)行對(duì)比。
混合核函數(shù)的形式為[9-10]

式中:Kpoly為多項(xiàng)式核函數(shù);Krbf為RBF核函數(shù)。對(duì)于輸入空間的不同區(qū)域,混合核系數(shù)的特征由不同的ρ所決定。ρ為一個(gè)向量。通過引入混合核系數(shù),不同核對(duì)模型的相對(duì)貢獻(xiàn)可以通過系數(shù)來加以調(diào)節(jié)。在本文中,對(duì)于整個(gè)輸入空間采用統(tǒng)一的核系數(shù)ρ。
封裝模式的特征選擇涉及到特征子集的選擇和評(píng)估模型的確定。在以往的特征選擇研究中,通常將特征選擇與模型確定分開,即先進(jìn)行特征的優(yōu)化選擇,然后再進(jìn)行模型的確定,實(shí)質(zhì)上是一種分步優(yōu)化的方法。但實(shí)際上,在封裝模式下,當(dāng)選擇優(yōu)化的特征子集時(shí),優(yōu)化的評(píng)估模型也就建立了起來,二者的優(yōu)化過程是相互影響的。因此,考慮到封裝模式進(jìn)行特征選擇的特點(diǎn),本文提出一種聯(lián)合優(yōu)化的方法,即將特征的選擇以及評(píng)估模型的確定同時(shí)進(jìn)行。
鑒于粒子群優(yōu)化 (particle swarm optimization,PSO)算法所具有的個(gè)體數(shù)目少、計(jì)算簡單、魯棒性好、容易實(shí)現(xiàn)并且沒有許多參數(shù)需要調(diào)整等諸多優(yōu)勢(shì)[11],及其在函數(shù)優(yōu)化、神經(jīng)網(wǎng)絡(luò)訓(xùn)練、模糊系統(tǒng)控制等許多領(lǐng)域的廣泛應(yīng)用[12-15],本文采用PSO算法在一個(gè)共同的目標(biāo)下實(shí)施聯(lián)合優(yōu)化,同時(shí)完成特征的選擇和模型的優(yōu)化。運(yùn)用PSO算法確定特征子集和評(píng)估模型的關(guān)鍵問題是定義自變量和目標(biāo)函數(shù) (適應(yīng)度函數(shù))。
由于需要聯(lián)合優(yōu)化特征和評(píng)估模型,因此,對(duì)于自變量的設(shè)定采用一種混合的形式,即同時(shí)包含特征和模型參數(shù)。
2.1.1 傳統(tǒng)的特征選擇
對(duì)于傳統(tǒng)的特征選擇方法,設(shè)定特征為離散變量0或1,如果第i個(gè)特征為1,則表示該特征被選中,否則這個(gè)特征就被舍棄。
評(píng)估模型的參數(shù)與SVM以及核函數(shù)的類型有關(guān),其取值對(duì)于學(xué)習(xí)能力和推廣能力都有很大的影響。對(duì)于SVM,其損失函數(shù)選取為ε不敏感損失函數(shù),具體形式為

因此,對(duì)于基于混合核函數(shù)的SVM模型,其參數(shù)包括正則化參數(shù)γ、不敏感參數(shù)ε、多項(xiàng)式核中的多項(xiàng)式階數(shù)d、RBF核中的參數(shù)σ2以及混合核系數(shù)ρ。
這些參數(shù)對(duì)模型的性能起著至關(guān)重要的影響。

2.1.2 加權(quán)特征選擇
對(duì)于加權(quán)特征選擇,此時(shí)的自變量集由特征1權(quán)重、特征2權(quán)重,…,特征p權(quán)重,以及正則化參數(shù)γ,不敏感參數(shù)ε,多項(xiàng)式核參數(shù)d,RBF核參數(shù)σ2,混合核系數(shù)ρ等模型參數(shù)組成。
加權(quán)特征選擇中,特征的選取不再是簡單的0或1,而是介于0~1之間的某個(gè)權(quán)值。由此可以看出,通常所進(jìn)行的特征選擇只是加權(quán)特征選擇方法的一種特殊情況。采用連續(xù)的PSO算法就可以聯(lián)合優(yōu)化實(shí)現(xiàn)特征的加權(quán)選擇和評(píng)估模型的優(yōu)化。
適應(yīng)度用來描述在被選特征子集下所建立的評(píng)估模型的性能。在確定了特征子集以后,就可以選參數(shù)γ是在結(jié)構(gòu)風(fēng)險(xiǎn)和樣本誤差之間作出折衷,參數(shù)γ的取值與可容忍的誤差相關(guān),較大的γ值允許較小的誤差,較小的γ值則允許較大的誤差。不敏感參數(shù)ε則與噪聲水平相關(guān),其取值一般與噪聲水平成比例關(guān)系,較小的ε能夠使SVM對(duì)數(shù)據(jù)的逼近效果非常好,但是容易造成過度擬合,使得模型在推廣應(yīng)用時(shí)存在很大的風(fēng)險(xiǎn);較大的ε推廣應(yīng)用的風(fēng)險(xiǎn)較小,但是模型對(duì)現(xiàn)有數(shù)據(jù)的擬合能力較差,對(duì)現(xiàn)有數(shù)據(jù)的規(guī)律體現(xiàn)得不夠。核函數(shù)中參數(shù)的取值直接決定了數(shù)據(jù)轉(zhuǎn)換后特征空間的特性[10]。因此,需要根據(jù)實(shí)際情況進(jìn)行優(yōu)化選擇。
特征選擇時(shí),聯(lián)合優(yōu)化的自變量集由特征1,特征2,…,特征p;正則化參數(shù)γ,不敏感參數(shù)ε,多項(xiàng)式核參數(shù)d,RBF核參數(shù)σ2及混合核系數(shù)ρ等組成。具體的數(shù)值更新采用二進(jìn)制PSO算法和連續(xù)PSO算法混合進(jìn)行。評(píng)估模型中相關(guān)參數(shù)的取值范圍需要根據(jù)經(jīng)驗(yàn)設(shè)定。
連續(xù)PSO算法在文獻(xiàn) [16]中有詳細(xì)描述。對(duì)于二進(jìn)制PSO算法,與連續(xù)PSO算法類似,每個(gè)粒子表示長度為p的二進(jìn)制向量的值,速度更新公式保持不變,而位置更新采用下式進(jìn)行:擇適當(dāng)?shù)臄?shù)據(jù)作為樣本建立評(píng)估模型了。為充分提高所建立模型的泛化能力,采用L折交叉驗(yàn)證的方式來評(píng)價(jià)訓(xùn)練的效果,對(duì)于測試樣本集的評(píng)價(jià),所采用的指標(biāo)為均方根誤差 (rootofmean square error,RMSE),具體表達(dá)式為


為說明方法的有效性,本文選取文獻(xiàn)[3]中的有關(guān)數(shù)據(jù),針對(duì)導(dǎo)彈武器系統(tǒng)的效能評(píng)定問題展開研究,幾種導(dǎo)彈的特征參數(shù)與系統(tǒng)效能如表1所示。

表1 幾種導(dǎo)彈的參數(shù)和系統(tǒng)效能Tab.1 Parameters and system effectiveness of several types ofmissiles
為了與不實(shí)施特征選擇時(shí)建模的效果進(jìn)行對(duì)比分析,本文對(duì)模型建立中的各種參數(shù)采用統(tǒng)一的設(shè)置。參數(shù)范圍統(tǒng)一設(shè)置為:γ∈[0.001 100];d∈[0.001 12];σ2∈[0.001 3 000];ρ∈[0.001 1];ε∈[0.001 0.02]。
PSO算法中:粒子最大速度Vmax=20;總粒子數(shù)為τ=20;加速因子c1=c2=5;慣性因子ω從0.9隨著迭代次數(shù)的增加線性遞減到0.4;最大迭代次數(shù)100??紤]到PSO算法的隨機(jī)性,按照設(shè)定的情況計(jì)算20次,取其中效果最好的1次作為訓(xùn)練結(jié)果。
本文針對(duì)全部特征、特征選擇和加權(quán)特征選擇3種情況分別建立評(píng)價(jià)模型,采用PSO算法對(duì)模型進(jìn)行優(yōu)化,計(jì)算得到的優(yōu)化結(jié)果如表2所示。3種情況下評(píng)價(jià)模型的優(yōu)化收斂過程如圖1所示。

表2 模型優(yōu)化結(jié)果Tab.2 Model optimization results

圖3 三種不同情況下模型優(yōu)化的收斂情況Fig.3 Model optimization convergences in three different situations
從計(jì)算結(jié)果可以看出:
1)全部特征與特征選擇
特征選擇的計(jì)算結(jié)果略優(yōu)于全部特征的結(jié)果,而且模型優(yōu)化的收斂效果也更好,通過選擇得到的特征也可以看出,特征選擇較全部特征時(shí)重點(diǎn)更為明確,對(duì)導(dǎo)彈武器系統(tǒng)效能影響較大的指標(biāo)是:導(dǎo)彈長度L、最大射高Hmax、導(dǎo)彈最大直徑dmax、最大射程Rmax和殺傷概率P。因此,為了能夠較好地提高武器系統(tǒng)的綜合效能,在論證設(shè)計(jì)時(shí)應(yīng)該重點(diǎn)從這幾個(gè)指標(biāo)加以權(quán)衡考慮。
2)特征選擇和加權(quán)特征選擇
加權(quán)特征選擇的計(jì)算結(jié)果則明顯優(yōu)化全部特征和特征選擇時(shí)的情況,而且模型優(yōu)化收斂的效果也非常好,表明從建模計(jì)算的角度,加權(quán)特征選擇有非常明顯的優(yōu)勢(shì)。從實(shí)際應(yīng)用的角度來看,加權(quán)特征選擇不是簡單地對(duì)特征進(jìn)行取舍,而是得出了各個(gè)指標(biāo)的權(quán)重或稱重要程度,具體排序情況是6>5>8>2>9>3>1>4>7。排在前面的5個(gè)特征就是通過特征選擇方法得到的5個(gè)特征,最終結(jié)果一致,但是相對(duì)于特征選擇方法而言,計(jì)算結(jié)果更為細(xì)致,得出的結(jié)果能夠反映出更多的信息,也更有利于武器系統(tǒng)效能評(píng)定的實(shí)際應(yīng)用。
為了更加有力地驗(yàn)證方法的有效性,本文在文獻(xiàn)[3]的基礎(chǔ)上,將幾種常用方法進(jìn)行對(duì)比,具體對(duì)比結(jié)果如表3所示。

表3 幾種常用效能評(píng)定方法的對(duì)比計(jì)算結(jié)果Tab.3 Calculation resultswith several common performance assessmentmethods
從表中的計(jì)算數(shù)據(jù)可以看出,Rough集&SVM方法所建立的模型較采用所有特征時(shí)建立的模型效果更好,由于這種處理方法將特征處理與模型構(gòu)建分離開來,雖然能夠獲得較好的擬合結(jié)果,但存在一定的特征信息丟失,而且對(duì)于所得到的特征集也無法進(jìn)一步區(qū)分;采用加權(quán)特征選擇方法對(duì)樣本的評(píng)估精度與Rough集&SVM方法相當(dāng),但是該方法充分利用了所選取特征的信息,而且對(duì)不同特征作出重要程度的區(qū)分,比較符合實(shí)際工作需求。
本文提出一種基于特征加權(quán)的武器系統(tǒng)效能綜合評(píng)定方法,不僅能夠得到戰(zhàn)術(shù)技術(shù)指標(biāo)與效能之間的關(guān)系用于效能評(píng)估,而且能夠區(qū)分各種戰(zhàn)術(shù)技術(shù)指標(biāo)對(duì)效能的影響程度,滿足武器系統(tǒng)效能綜合評(píng)定的需求,所提出的聯(lián)合優(yōu)化方法能夠同時(shí)實(shí)現(xiàn)特征的選擇和模型的優(yōu)化,應(yīng)用計(jì)算表明該方法的實(shí)踐效果優(yōu)于傳統(tǒng)的特征選擇方法。
該方法能夠取得比較好的效果,但是也存在一定不足:由于方法實(shí)施過程中是采用進(jìn)化算法迭代進(jìn)而獲取優(yōu)化的效能評(píng)估模型,計(jì)算量較其他方法要大,尤其是當(dāng)交叉驗(yàn)證折數(shù)較大時(shí)。因此,今后的一個(gè)研究重點(diǎn)是對(duì)現(xiàn)有優(yōu)化算法進(jìn)一步改進(jìn),使得能夠高效地得到滿意的結(jié)果。
[1]高尚,婁壽春.武器系統(tǒng)效能評(píng)定方法綜述[J].系統(tǒng)工程理論與實(shí)踐,1998(7):109-114.
GAO Shang,LOU Shou-chun.Summary of weapon system effectiveness evaluation method[J].Systems Engineering Theory and Practice,1998(7):109 -114.
[2]文仲輝.導(dǎo)彈系統(tǒng)分析與設(shè)計(jì)[M].北京:北京理工大學(xué)出版社,1989.
WEN Zhong-hui.Missile systems analysis and design[M].Beijing:Beijing Institute of Technology Press,1989.
[3]高尚,房靖.基于粗糙集和支持向量機(jī)的效能評(píng)定[J].系統(tǒng)工程與電子技術(shù),2008,30(7):1291-1294.
GAO Shang,F(xiàn)ANG Jing.Performance assessment based on rough sets and support vector machine[J].Systems Engineering and Electronics,2008,30(7):1291 -1294.
[4]KOHAVI R,JOHN G H.Wrappers for feature subset selection[J].Artificial Intelligence,1997,97(1 - 2):273-324.
[5]朱麗華.基于粗糙集和C-均值聚類支持向量機(jī)的員工績效評(píng)估方法[J].價(jià)值工程,2009,28(11):1 -4.
ZHU Li-hua.The performance evaluating method of employee based on rough set and C-means clustering support vector machine[J].Value Engineering,2009,28(11):1-4.
[6]吳沖,夏晗.基于五級(jí)分類支持向量機(jī)集成的商業(yè)銀行信用風(fēng)險(xiǎn)評(píng)估模型研究[J].預(yù)測,2009,28(4):57-61.
WU Chong,XIA Han.Credit risk assessment in commercial banks on five-class support vectormachines ensemble[J].Forecasting,2009,28(4):57 -61.
[7]孫瑾,許青松,陳燕燕.基于遺傳算法和支持向量機(jī)的銀行個(gè)人信用評(píng)估[J].統(tǒng)計(jì)與決策,2008(12):130-134.
SUN Jin,XU Qing-song,CHEN Yan-yan.Bank personal credit rating based on genetic algorithm and support vector machine[J].Statistics and Decision,2008(12):130 -134.
[8]張目,周宗放.基于多目標(biāo)規(guī)劃和支持向量機(jī)的企業(yè)信用評(píng)估模型[J].中國軟科學(xué),2009(4):185-190.
ZHANG Mu,ZHOU Zong-fang.An evaluation model for credit risk of enterprise based on multi-objective programming and support vector machines[J].China Soft Science,2009(4):185 -190.
[9]MAK B,KWOK J T,HO S.Kernel eigenvoice speaker adaptation[J].IEEE Transactions on Speech and Audio Processing,2005,13(5):984 -992.
[10]SMITSG F,JORDAN EM.Improved SVM regression using mixtures of kernels[C]//GirolamiM.Proc.of IJCNN 02 on Neural Networks.Piscataway,NJ:IEEE Press,2002:2785-2790.
[11]KENNEDY J,EBERHART R C.Swarm intelligence[M].San Francisco:Morgan Kaufmann Publishers,2001.
[12]TSENG C C,HSIEH JG,JENG JH.Active contourmodel via multi- population particle swarm optimization[J].Expert Systems with Applications,2009,36(3):5348-5352.
[13]JIN Ai,VORATAS K.Particle swarm optimization and two solution representations for solving the capacitated vehicle routing problem[J].Computers & Industrial Engineering,2009,56(1):380 -387.
[14]ALBERTO G V,RAFAEL P.Introducing dynamic diversity into a discrete particle swarm optimization[J].Computers& Operations Research,2009,36(3):951 -966.
[15]CLERC M,KENNEDY J.The particle swarm explosion,stability,and convergence in a multidimensional complex space[J].IEEE Transactions on Evolutionary Computer,2002,6(1):58 -73.
[16]GUOA YW,LIBW D,MILEHAMA A R,etal.Applications of particle swarm optimization in integrated process planning and scheduling[J].Robotics and Computer Integrated Manufacturing,2009,25(2):280 -288.
Assessmentmethod of weapon system effectiveness based on support vector machine with weighted feature
LIJing-xi1,JIANG Tie-jun2
(1.Ship Office of Naval Equipment Department,Beijing 100071,China;2.Department of Equipment Economy Management,Naval University of Engineering,Wuhan 430033,China)
The requirement ofweapon system effectiveness assessment and the importance analysis of tactical and technical indicators were taken into account,moreover,considering the shortcomings of the traditionalmethod of feature selection,A weighted feature selection with the supervised wrapper mode was used in the effectiveness assessment of weapon system,which can effectively distinguish the influence of different features on the system effectiveness.In view of the good application effects of support vector machine(SVM),aswell as a good performance of themixture of kernels,the relationship model among the features and the system effectivenesswas established based on SVM with themixture of kernels.In addition,considering the consistency of feature selection and the establishment of effectiveness assessmentmodel,a joint optimizationmethod based on particle swarm optimization(PSO)was adopted,which can synchronically achieve the influence analysis of features and the optimization of effectiveness assessment model.Experiments show that the proposed method is effective.
effectiveness assessment;weighted feature selection;support vectormachine;mixture of kernels;particle swarm optimization
TK42
A
1672-7649(2013)05-0011-06
10.3404/j.issn.1672-7649.2013.05.003
2012-07-05;
2012-09-26
李景熹(1979-),男,博士,工程師,研究方向?yàn)榕灤b備總體和裝備經(jīng)濟(jì)性分析等。