劉湘雯,石亞麗,馮霞
(1. 江蘇大學(xué)計(jì)算機(jī)科學(xué)與通信工程學(xué)院,江蘇 鎮(zhèn)江 212013;2. 安徽大學(xué)信息保障技術(shù)協(xié)同創(chuàng)新中心,安徽 合肥 230000)
基于弱分類器集成的車聯(lián)網(wǎng)虛假交通信息檢測(cè)
劉湘雯1,石亞麗1,馮霞2
(1. 江蘇大學(xué)計(jì)算機(jī)科學(xué)與通信工程學(xué)院,江蘇 鎮(zhèn)江 212013;2. 安徽大學(xué)信息保障技術(shù)協(xié)同創(chuàng)新中心,安徽 合肥 230000)
車聯(lián)網(wǎng)中車輛以自組織的方式相互報(bào)告交通信息,開放的網(wǎng)絡(luò)環(huán)境需要甄別消息,然而,要快速移動(dòng)的車輛在短時(shí)間內(nèi)檢測(cè)出大量的交通警報(bào)信息是非常困難的。針對(duì)這一問(wèn)題,提出一種基于弱分類器集成的虛假交通信息檢測(cè)方法。首先,擴(kuò)充交通警報(bào)信息的有效特征,并設(shè)計(jì)分割規(guī)則,將信息的特征集劃分為多個(gè)特征子集;然后,根據(jù)子集特征的不同特性,使用對(duì)應(yīng)的弱分類器分別進(jìn)行處理。仿真實(shí)驗(yàn)和性能分析表明,選用弱分類器集成方法檢測(cè)車聯(lián)網(wǎng)中的虛假交通信息減少了檢測(cè)時(shí)間,且由于綜合特征的應(yīng)用,檢測(cè)率優(yōu)于僅使用部分特征的檢測(cè)結(jié)果。
車聯(lián)網(wǎng);虛假信息檢測(cè);弱分類器集成;BP神經(jīng)網(wǎng)絡(luò)
隨著移動(dòng)通信技術(shù)、物聯(lián)網(wǎng)和無(wú)線傳感網(wǎng)絡(luò)技術(shù)的廣泛應(yīng)用,車聯(lián)網(wǎng)逐漸成為智能交通的有效途徑之一[1]。車聯(lián)網(wǎng)可為車輛提供交互通信功能,通過(guò)信息的共享和及時(shí)發(fā)布,在事故預(yù)警、保障交通安全以及為用戶提供舒適的駕駛環(huán)境等方面起到巨大的作用[2]。在交通安全應(yīng)用中,車聯(lián)網(wǎng)中的車輛節(jié)點(diǎn)向鄰居車輛廣播交通信息,如車輛位置、速度、加速度等,提前告知道路狀況,從而降低交通阻塞帶來(lái)的時(shí)間和資源的浪費(fèi),提高交通安全[3]。然而,車聯(lián)網(wǎng)處于開放環(huán)境,無(wú)法排除惡作劇用戶、軟硬件損壞或惡意入侵情況的存在,已知的攻擊種類包括位置偽造[4]、信息的竊聽、篡改[5]、抑制[5]、重放[6]以及數(shù)據(jù)分組拘留[6]等攻擊方式,導(dǎo)致交通警報(bào)信息被修改、延遲、丟棄,甚至損害到車聯(lián)網(wǎng)應(yīng)用帶來(lái)的效益,危害駕乘者的生命財(cái)產(chǎn)安全,造成更嚴(yán)重的交通事故。為此,檢測(cè)虛假信息以確保交通信息的真實(shí)性,成為車聯(lián)網(wǎng)安全駕駛的重要方面。
對(duì)車聯(lián)網(wǎng)中虛假警報(bào)信息的檢測(cè)方案主要有 2類。1)判斷節(jié)點(diǎn)是否異常。這類方案的基本假設(shè)為“異常節(jié)點(diǎn)發(fā)出的信息一定是虛假的”,通過(guò)節(jié)點(diǎn)間的信息交互實(shí)現(xiàn)對(duì)信息源節(jié)點(diǎn)的判斷。其優(yōu)點(diǎn)是檢測(cè)方法簡(jiǎn)單,對(duì)處理器的計(jì)算能力要求低,適用于快速實(shí)時(shí)計(jì)算能力相對(duì)較低的車聯(lián)網(wǎng)環(huán)境,但此類方案對(duì)正常節(jié)點(diǎn)與惡意節(jié)點(diǎn)相對(duì)數(shù)量要求較高,只有當(dāng)正常節(jié)點(diǎn)的數(shù)目多于異常節(jié)點(diǎn)時(shí),才能充分發(fā)揮較好的性能;如果網(wǎng)絡(luò)中存在數(shù)量上相近或者局部占優(yōu)的惡意節(jié)點(diǎn),會(huì)導(dǎo)致該方法整體失效,對(duì)消息的判斷準(zhǔn)確率也大大降低[7]。如一個(gè)信任度較高的節(jié)點(diǎn)恰好發(fā)出了一條虛假信息。2)基于警報(bào)信息自身的特征進(jìn)行虛假信息的分類研究[8]。這類方案輸入的警報(bào)信息特征越多,識(shí)別的效率越高,其缺點(diǎn)是識(shí)別算法復(fù)雜度較高,警報(bào)信息很多時(shí),計(jì)算導(dǎo)致的時(shí)延往往會(huì)損害警報(bào)信息的時(shí)效性。更為重要的是,車聯(lián)網(wǎng)的應(yīng)用往往在高密度或者高速度的交通場(chǎng)景下,出于對(duì)提前預(yù)報(bào)的需求,網(wǎng)絡(luò)信息的覆蓋范圍及網(wǎng)絡(luò)規(guī)模通常較大,每個(gè)節(jié)點(diǎn)都會(huì)接受并處理大量其他車輛發(fā)送的警報(bào)信息。通常而言,基于節(jié)點(diǎn)行為判斷的方案通信負(fù)荷會(huì)過(guò)大,而基于預(yù)警信息特征的方案,由于計(jì)算負(fù)荷較大,會(huì)導(dǎo)致較大的時(shí)延,從而降低車聯(lián)網(wǎng)所提供的交通信息預(yù)警效果。
本文提出一種基于弱分類器集成的虛假交通信息檢測(cè)方法。該方法首先擴(kuò)充警報(bào)信息包含的特征值,如將發(fā)送者的特征(車輛信譽(yù)值、信息發(fā)送時(shí)車輛節(jié)點(diǎn)所在的位置等)作為消息分組的一部分;然后根據(jù)警報(bào)信息豐富的綜合特征,檢測(cè)預(yù)警信息的真假。為提高檢測(cè)效率,將綜合特征分割成若干特征子集,利用不同的弱分類器對(duì)部分特征子集并行處理,并將處理結(jié)果集成,根據(jù)警報(bào)事件的可信度進(jìn)行二次判斷。方法的主要特點(diǎn)如下。
1)將豐富的節(jié)點(diǎn)特征包含在消息分組中,融合了節(jié)點(diǎn)信息和消息信息雙重特征,為檢測(cè)率的提高提供了足夠的信息特征。
2)新型分組雖然增加了單次分組傳輸?shù)耐ㄐ糯鷥r(jià),但是減少了基于節(jié)點(diǎn)識(shí)別的通信次數(shù),從而降低了檢測(cè)的整體通信代價(jià)。
3)采用多個(gè)弱分類器并行處理的方法,降低了計(jì)算代價(jià),虛假警報(bào)檢測(cè)的時(shí)效性得到充分保證,同時(shí)還提高了檢測(cè)率。
現(xiàn)有的關(guān)于車聯(lián)網(wǎng)虛假警報(bào)信息檢測(cè)方案主要分為對(duì)節(jié)點(diǎn)行為異常的判斷和對(duì)警報(bào)信息特征的分類研究。前者采用的主要方法有基于信任機(jī)制和基于投票機(jī)制2種;而后者的研究主要以數(shù)據(jù)為中心,集中在設(shè)計(jì)計(jì)算能力低且識(shí)別效果好的分類器以及通過(guò)各種渠道獲取豐富的警報(bào)信息特征上。
基于信任機(jī)制[8~11]的方法根據(jù)車輛信譽(yù)值的高低來(lái)判別該車輛是否提供虛假交通信息。Abdelaziz等[8]提出有效的信任模型,根據(jù)上一個(gè)轉(zhuǎn)發(fā)節(jié)點(diǎn)的觀點(diǎn)和接收消息的驗(yàn)證延遲來(lái)檢測(cè)和撤銷不誠(chéng)實(shí)的節(jié)點(diǎn)以及控制惡意數(shù)據(jù),并引入同伴車輛的概念確定最短和最信任的路徑傳遞數(shù)據(jù)分組。Ding等[9]提出基于事件的信譽(yù)模型過(guò)濾虛假警報(bào)消息,該方法將遇到相同事件的所有車輛分為不同角色,采用動(dòng)態(tài)的基于角色的信譽(yù)評(píng)估機(jī)制來(lái)決定交通信息是否可信。Zhang等[10]提出一種車聯(lián)網(wǎng)中基于信任模型的消息評(píng)估和傳播框架,該框架在消息傳播過(guò)程中,主動(dòng)檢測(cè)惡意信息,使用一系列的信任度量指標(biāo),包括同伴車輛的信任關(guān)系、信任意見、基于經(jīng)驗(yàn)的信任度、基于角色的信任度等,對(duì)同伴車輛節(jié)點(diǎn)間共享的信息質(zhì)量進(jìn)行建模。Shaikh等[11]則針對(duì)不同節(jié)點(diǎn)發(fā)出的關(guān)于同一事件的消息,利用接收節(jié)點(diǎn)計(jì)算所有消息信任值,并接收信任值最大的那條消息為真實(shí)信息,實(shí)現(xiàn)對(duì)車輛網(wǎng)中具有匿名身份的車輛節(jié)點(diǎn)的信任管理。
基于投票機(jī)制[12,13]的方法中,Ostermaier等[12]提出基于信息中心評(píng)估危害信息的可信性的安全機(jī)制,該方法用4種投票機(jī)制來(lái)判斷當(dāng)?shù)匚kU(xiǎn)警告。Li等[13]提出一種基于不同交通場(chǎng)景的混合式入侵行為檢測(cè)機(jī)制,當(dāng)車輛不在同一道路上行駛時(shí),使用局部投票的VOTE方法進(jìn)行入侵檢測(cè)。
上述方法以車輛節(jié)點(diǎn)為中心,對(duì) RSU和信譽(yù)度高的節(jié)點(diǎn)的依賴程度大,導(dǎo)致虛假警報(bào)信息的檢測(cè)效率較低。因此,一部分研究者提出以數(shù)據(jù)為中心的基于警報(bào)信息特征的檢測(cè)方案。如 Kim等[14]利用豐富的互補(bǔ)信息來(lái)源構(gòu)建多源檢測(cè)模型,信息源包括加密認(rèn)證、事件位置、當(dāng)?shù)貍鞲衅?、其他車輛反應(yīng)行為、RSU驗(yàn)證、發(fā)送者的信任值。該模型結(jié)合各種不同來(lái)源的信息計(jì)算事件信任值,并根據(jù)事件距離接收者位置的遠(yuǎn)近設(shè)置閾值,當(dāng)事件信任值超過(guò)閾值時(shí),OBU才會(huì)觸發(fā)警報(bào)通知駕駛者。Zhang等[15]則通過(guò)設(shè)計(jì)高效的分類器識(shí)別虛假信息,提出一種車聯(lián)網(wǎng)中基于增量學(xué)習(xí)的BP神經(jīng)網(wǎng)絡(luò)的虛假消息過(guò)濾器。為提高識(shí)別精度,該方法采用2層過(guò)濾機(jī)制——粗過(guò)濾和細(xì)過(guò)濾。粗過(guò)濾通過(guò)數(shù)字簽名、時(shí)間、地理位置以及 RSU對(duì)信息的支持這些特征來(lái)判斷消息的真實(shí)性;細(xì)過(guò)濾將車聯(lián)網(wǎng)交通信息中發(fā)送者與接收者之間的距離、事件與發(fā)送者之間的距離、發(fā)送者當(dāng)前速度、發(fā)送者的信譽(yù)值等特征作為輸入量,由神經(jīng)網(wǎng)絡(luò)分類器給出是否為虛假信息的判斷。Zhang等[15]以信譽(yù)值作為輔助,首次提出使用BP神經(jīng)網(wǎng)絡(luò)直接對(duì)警報(bào)信息進(jìn)行檢測(cè),比以節(jié)點(diǎn)為中心的檢測(cè)方法針對(duì)性更強(qiáng),并通過(guò)實(shí)驗(yàn)驗(yàn)證了該方法對(duì)虛假警報(bào)信息的過(guò)濾效果更好。
表1對(duì)上述幾種方法進(jìn)行了歸納,比較其優(yōu)缺點(diǎn)并進(jìn)行綜合分析。在此基礎(chǔ)上,提出一種基于弱分類器集成的虛假交通信息檢測(cè)方法,首先,增加警報(bào)信息中的節(jié)點(diǎn)特征,并對(duì)特征分類;然后,在基于信息特征檢測(cè)的方法中,用適合各類特征特點(diǎn)的弱分類器集成方法,實(shí)現(xiàn)更多特征、更低計(jì)算代價(jià)和更高檢測(cè)率的綜合性能。
本文采用典型的 VANET系統(tǒng)模型(如圖 1所示)。該系統(tǒng)模型主要包含3個(gè)實(shí)體:可信權(quán)威機(jī)構(gòu)(TA,trust authority)、固定在路邊的基礎(chǔ)設(shè)施(RSU,road-side unit)和配備在車輛上的車載單元(OBU,on-board unit)。各實(shí)體的主要功能如下。
1)TA:TA主要負(fù)責(zé)為網(wǎng)絡(luò)中的RSU和OBU發(fā)布密鑰信息。車輛發(fā)送的交通信息需要經(jīng)過(guò)密鑰簽名以實(shí)現(xiàn)對(duì)虛假信息發(fā)布者的認(rèn)證,并防止真實(shí)信息被惡意車輛篡改。

圖1 VANET系統(tǒng)模型
2)RSU:RSU主要負(fù)責(zé)向其通信范圍內(nèi)的車輛發(fā)布信息,通常認(rèn)為 RSU自主發(fā)布的信息是真實(shí)可信的,可以作為虛假信息檢測(cè)的依據(jù)。同時(shí),RSU也負(fù)責(zé)對(duì)車輛和TA的信息進(jìn)行存儲(chǔ)轉(zhuǎn)發(fā)。RSU還可以在空閑情況下,對(duì)接收的交通信息進(jìn)行虛假檢測(cè)。
3)OBU:OBU主要負(fù)責(zé)發(fā)布交通信息,它可以通過(guò)V2V或V2I的方式進(jìn)行通信。同時(shí),OBU是虛假信息檢測(cè)的主要實(shí)體。
本文采用了與文獻(xiàn)[8]相似的安全假設(shè)。
假設(shè)1:車輛都配備GPS設(shè)備、前后向紅外線雷達(dá)(假設(shè)雷達(dá)掃描半徑為200 m)、紅外線信號(hào)接收設(shè)備、無(wú)線信號(hào)收發(fā)器以及各種傳感器,用于感知道路上的相關(guān)信息,且信息內(nèi)容不能被篡改。

表1 車聯(lián)網(wǎng)虛假信息檢測(cè)方法
假設(shè) 2:車聯(lián)網(wǎng)中大部分車輛發(fā)送的警報(bào)信息是可信的。
惡意攻擊者針對(duì)車聯(lián)網(wǎng)中警報(bào)信息的攻擊方式主要有散布虛假信息和阻礙信息傳播[5,16]。
散布虛假信息是指攻擊者通過(guò)發(fā)布偽造的虛假信息,篡改真實(shí)信息,或者注入無(wú)效信息改變其他車輛駕駛行為。如當(dāng)合法車輛收到虛假的前方擁堵的警報(bào)信息時(shí),可能會(huì)改變行駛路線。
阻礙信息傳播是指攻擊者抑制、拘留警報(bào)信息,甚至發(fā)動(dòng)選擇性傳遞攻擊。選擇性傳遞攻擊[16]能夠結(jié)合如蟲洞攻擊、女巫攻擊等一些針對(duì)路由發(fā)動(dòng)的攻擊,發(fā)揮顯著的破壞作用。如惡意車輛將通過(guò)自身的交通事故警報(bào)丟棄,導(dǎo)致后方車輛不能接收到警報(bào)通知,使其沒(méi)有時(shí)間做出正確反應(yīng),甚至可能導(dǎo)致連環(huán)碰撞事件的發(fā)生。
本文主要針對(duì)散布虛假消息這一攻擊方式,采用弱分類器并行檢測(cè)技術(shù),從分割為多個(gè)特征子集的警報(bào)信息中檢測(cè)出虛假信息。
在實(shí)際交通環(huán)境中,車輛行駛安全會(huì)受車速、實(shí)時(shí)路況信息以及突發(fā)情況下駕駛員的操作反應(yīng)等因素的影響[17]。將發(fā)送警報(bào)信息的車輛節(jié)點(diǎn)信息和事件信息相結(jié)合,共同作為警報(bào)信息的有效特征,有助于對(duì)虛假警報(bào)的檢測(cè)。因此,對(duì)警報(bào)信息分組的有效特征進(jìn)行擴(kuò)充,車輛節(jié)點(diǎn)向鄰居節(jié)點(diǎn)廣播的信息中包含事件特征信息和車輛自身狀態(tài)信息。表2列出交通警報(bào)信息分組中的有效特征,其中,特征名稱后面括號(hào)中的符號(hào)為該特征的簡(jiǎn)稱。

表2 交通警報(bào)信息報(bào)文中的有效特征
1)Sender為發(fā)送者的類型。s為0表示警報(bào)信息由 RSU自主發(fā)布,認(rèn)為該信息完全可信,可作為訓(xùn)練數(shù)據(jù);s為1表示信息由車輛節(jié)點(diǎn)發(fā)送。
2)Priority為交通警報(bào)信息的優(yōu)先級(jí)。不同的安全警報(bào)事件設(shè)置不同的p值。如碰撞警告設(shè)置為1、緊急車輛警告設(shè)置為2,p值越小優(yōu)先級(jí)越高。
3)Occur time和Occur site分別為事件發(fā)生的時(shí)間t0和地點(diǎn)l0。
4)Trans time、Trans site、Vehicle vel和 Vehicle acc分別為發(fā)送警報(bào)信息的時(shí)間ts、警報(bào)信息發(fā)送時(shí)發(fā)送車輛的位置ls、速度vs和加速度as。
5)Direction為車輛發(fā)送分組時(shí)的行駛方向ds。以正北方向?yàn)?度,通過(guò)對(duì)比車輛行駛與正北方向的夾角來(lái)判斷ds,一跳兩端節(jié)點(diǎn)車輛若同向行駛?cè)≈?,反向取值0。
6)Reputation為發(fā)送車輛的信譽(yù)值rs,主要根據(jù)車輛的歷史行為得到。若發(fā)現(xiàn)車輛存在攻擊行為,則降低rs。
7)Retransmit為警報(bào)信息轉(zhuǎn)發(fā)的次數(shù)n。某個(gè)警報(bào)信息的n值越大,該警報(bào)信息的可信度就越低。設(shè)定當(dāng)n>10時(shí),不再轉(zhuǎn)發(fā)此警報(bào)信息。
擴(kuò)充警報(bào)信息的特征在提高虛假信息檢測(cè)精度的同時(shí),也會(huì)增加檢測(cè)警報(bào)信息的算法復(fù)雜度,當(dāng)接收到大量警報(bào)信息時(shí),檢測(cè)警報(bào)的時(shí)延會(huì)破壞警報(bào)信息的時(shí)效性。因此,本文采取將警報(bào)信息中的有效特征分割到不同的集合中,分別同時(shí)進(jìn)行檢測(cè),以減少檢測(cè)時(shí)間。
具體做法為:根據(jù)警報(bào)信息的不同特征設(shè)計(jì)分割規(guī)則,建立事件緊急度、道路狀況、信息可信度3個(gè)特征子集,將耦合度較高的特征歸入對(duì)應(yīng)的特征子集中。表3為分割后的特征子集和特征對(duì)應(yīng)表。

表3 警報(bào)信息的特征分割
1)事件緊急度
主要和事件的優(yōu)先級(jí)、事件與接收者之間的距離有關(guān),同時(shí),事件發(fā)生時(shí)間也作為判斷事件緊急度的參考因素。因此,特征子集1中包含有t0、l0、p這3個(gè)特征。特征p有具體的值,而對(duì)于特征t0、l0由于不同車輛存在事件距離不同,反應(yīng)時(shí)間等特殊因素,使t0、l0在可接受的范圍內(nèi)有一定的誤差。
2)道路狀況
主要與發(fā)送警報(bào)信息車輛的自身狀態(tài)信息有關(guān)。在特征子集 2中包含特征 ts、ls、vs、as、ds,該特征子集中的特征維數(shù)較多。
3)信息可信度
主要受發(fā)送警報(bào)信息的實(shí)體信譽(yù)值和警報(bào)信息轉(zhuǎn)發(fā)次數(shù)的影響。rs與自身的歷史行為有關(guān)并受其他車輛的評(píng)估,n與警報(bào)轉(zhuǎn)發(fā)的次數(shù)有關(guān)。
WCIT方法在檢測(cè)警報(bào)信息是否為虛假信息時(shí),主要根據(jù)警報(bào)信息中發(fā)送節(jié)點(diǎn)的特征值和事件的特征值(如表2所示)進(jìn)行判斷。首先,信息收集模塊收集警報(bào)信息并分類;其次,預(yù)處理模塊提取警報(bào)信息的特征,并判斷待檢測(cè)信息的有效性和可信性;然后,虛假交通信息檢測(cè)模塊將特征分入不同的特征子集,并輸入到各自的弱分類器中進(jìn)行訓(xùn)練,得出檢測(cè)結(jié)果;最后,如果是有效警報(bào)信息,后期處理模塊完成預(yù)警處理等后續(xù)工作。圖2為基于弱分類器集成的虛假交通信息檢測(cè)方法框架。

圖2 基于弱分類器集成的虛假信息檢測(cè)方法框架
信息收集模塊實(shí)現(xiàn)信息分類。通過(guò)傳感器探測(cè),將RSU發(fā)布的警報(bào)作為訓(xùn)練數(shù)據(jù),將鄰居節(jié)點(diǎn)轉(zhuǎn)發(fā)的警報(bào)信息作為待檢測(cè)數(shù)據(jù)。當(dāng)訓(xùn)練數(shù)據(jù)由于其他原因不能使用或不足而無(wú)法訓(xùn)練時(shí),將隨機(jī)的待檢測(cè)信息作為訓(xùn)練補(bǔ)充。警報(bào)信息可表示為Iis,表示由節(jié)點(diǎn)s發(fā)送的關(guān)于事件i的警報(bào)信息。信息收集模塊對(duì)確定事件的真實(shí)性具有決定性因素,本文方案假設(shè)的場(chǎng)景是高密度交通場(chǎng)景,為此可保證警報(bào)的事件擁有充足的來(lái)源。信息收集模塊流程如圖3所示。

圖3 信息收集模塊流程
預(yù)處理模塊的任務(wù)包括警報(bào)信息中有效特征的提取、警報(bào)信息的有效性檢測(cè)和信息的可信度判斷。
警報(bào)信息中有效特征的提取過(guò)程表示為

其中,F(xiàn)is(k)表示節(jié)點(diǎn)s發(fā)送的關(guān)于事件i的第k個(gè)警報(bào)信息的有效特征。
為了減少因檢測(cè)無(wú)效警報(bào)信息而造成的時(shí)間浪費(fèi),需要對(duì)警報(bào)信息的有效性進(jìn)行判斷,將超過(guò)時(shí)間和空間范圍的信息舍棄。警報(bào)信息的時(shí)間有效性表示為

其中,t表示接收警報(bào)信息的時(shí)間,ts表示警報(bào)信息發(fā)送或轉(zhuǎn)發(fā)的時(shí)間。當(dāng)式(2)成立時(shí),對(duì)該警報(bào)信息進(jìn)行虛假檢測(cè),否則直接丟棄該信息。
判斷警報(bào)信息的空間有效性主要根據(jù)事件發(fā)生的位置l0是否在接收車輛的前方,如果事件發(fā)生在接收車輛的后方,接收車輛不考慮該警報(bào),因?yàn)樵撌录粫?huì)對(duì)其產(chǎn)生影響。
計(jì)算信息的可信度則是作為后期處理模塊中判斷虛假警報(bào)信息的依據(jù)。由于車輛接收的警報(bào)信息可能經(jīng)過(guò)多跳轉(zhuǎn)發(fā),經(jīng)過(guò)的轉(zhuǎn)發(fā)車輛越多,警報(bào)的真實(shí)性就越低。警報(bào)信息的可信度表示為

其中,μ為可信參數(shù),rs為發(fā)送節(jié)點(diǎn)s的信譽(yù)值,ni為警報(bào)信息轉(zhuǎn)發(fā)的跳數(shù)。
圖4是待檢測(cè)警報(bào)信息的預(yù)處理流程。RSU發(fā)出的警報(bào)信息是真實(shí)可信的有效信息,作為訓(xùn)練數(shù)據(jù)進(jìn)行預(yù)處理時(shí),只需完成特征信息的提取。

圖4 待檢測(cè)警報(bào)信息預(yù)處理流程
虛假交通信息檢測(cè)模塊將預(yù)處理后的警報(bào)信息進(jìn)行特征分割,將部分特征子集分別輸入到對(duì)應(yīng)的弱分類器中,利用學(xué)習(xí)算法訓(xùn)練得到警報(bào)信息的模式(w1,w2)并將其存儲(chǔ)在模式庫(kù)中。檢測(cè)警報(bào)信息時(shí),將各子集檢測(cè)得到的結(jié)果集成,再與事件模式進(jìn)行匹配,并結(jié)合信息可信度判斷出虛假警報(bào)。具體流程如圖5所示。

圖5 虛假信息檢測(cè)模塊流程
1)BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法
由于 BP神經(jīng)網(wǎng)絡(luò)具有較強(qiáng)的非線性映射能力、高度學(xué)習(xí)和自適應(yīng)能力,且具有良好的泛化和一定的容錯(cuò)能力,因此,被用作警報(bào)信息的特征子集 1的分類方法。BP神經(jīng)網(wǎng)絡(luò)權(quán)值調(diào)整采用反向傳播的學(xué)習(xí)算法,它利用均方誤差和梯度下降法來(lái)實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)連接權(quán)值的修正。為了加快收斂速度,防止陷入局部極小值,在此使用動(dòng)量—自適應(yīng)學(xué)習(xí)率調(diào)整BP算法加快檢測(cè)速度。動(dòng)量—自適應(yīng)學(xué)習(xí)率BP神經(jīng)網(wǎng)絡(luò)的權(quán)值修正可表示為

其中,w(k)為第 k步時(shí)的權(quán)值,D(k)為第 k步時(shí)的負(fù)梯度,η為動(dòng)量因子,α為學(xué)習(xí)率。
2)支持向量機(jī)學(xué)習(xí)算法
支持向量機(jī)(SVM)對(duì)非線性和高維數(shù)據(jù)具有很好的識(shí)別能力和良好的泛化能力,因此,被用作對(duì)警報(bào)信息的特征子集2的分類方法。警報(bào)信息的特征子集2是五維的特征向量,通過(guò)SVM算法找到一個(gè)最優(yōu)分類超平面以最大間隔將真實(shí)數(shù)據(jù)與虛假數(shù)據(jù)分開。
最優(yōu)分類超平面問(wèn)題可以表示為

其中,ξi為松弛變量,C為懲罰因子,w、b分別為權(quán)值和閾值。
后期處理模塊需要根據(jù)警告信息完成預(yù)警處理、轉(zhuǎn)發(fā)有效信息和調(diào)整車輛信譽(yù)值。圖6是后期處理模塊流程。
預(yù)警處理是要在接收到有效的警報(bào)信息時(shí),立即警告駕駛?cè)耍龊冒踩珣?yīng)急措施。
轉(zhuǎn)發(fā)有效信息是指將有效警報(bào)信息發(fā)送給同向并在本車后方的車輛。
另外,還要根據(jù)車輛提供消息的真假,修改相關(guān)車輛的信譽(yù)值rs。如果車輛發(fā)送的是真實(shí)信息,則增加rs,否則減少rs,并發(fā)送修改后的rs給RSU,更新本地信譽(yù)值列表。

圖6 后期處理模塊流程
本文利用交通仿真軟件 VanetMobisim搭建道路仿真場(chǎng)景,模擬車輛的運(yùn)動(dòng)軌跡,獲取訓(xùn)練和檢測(cè)所需的警報(bào)信息。在相同情況下,分別使用本文提出的WCIT方法和BPNN方法[15]對(duì)待檢測(cè)警報(bào)信息中的虛假信息進(jìn)行檢測(cè),并比較這2種方法在檢測(cè)開銷和檢測(cè)率方面的性能。此外,從理論上比較并分析WCIT方法和多源信息檢測(cè)過(guò)濾方法[14]的通信開銷,進(jìn)而驗(yàn)證本文方法的整體性能。
本文在VanetMobiSim中搭建了一個(gè)1 000 m×1 000 m的二維城市環(huán)境,利用xml的配置文件進(jìn)行宏觀和微觀模型參數(shù)的設(shè)置,車道設(shè)置為常見的雙向車道,選擇100個(gè)車輛節(jié)點(diǎn)按著道路隨機(jī)移動(dòng),每0.05 s對(duì)各個(gè)節(jié)點(diǎn)的位置進(jìn)行模擬。仿真參數(shù)如表4所示。

表4 交通仿真參數(shù)配置
WCIT方法中根據(jù)特征子集1檢測(cè)虛假信息和BPNN方法中使用細(xì)過(guò)濾模塊檢測(cè)虛假信息都采用BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,對(duì)BP神經(jīng)網(wǎng)絡(luò)的相關(guān)設(shè)定如下。輸入神經(jīng)元數(shù)為3(如表3所示,特征子集1),輸出神經(jīng)元數(shù)為1(值為1或0,1表示有效信息,0表示虛假信息),隱層神經(jīng)元數(shù)為4,誤差精度0.000 1,激勵(lì)函數(shù)為訓(xùn)練次數(shù) 300次,輸入數(shù)據(jù)在訓(xùn)練和檢測(cè)之前都要進(jìn)行歸一化處理。
此外,本文根據(jù)特征子集2檢測(cè)虛假信息時(shí),采用SVM學(xué)習(xí)算法。建模前,先對(duì)特征子集2中的5個(gè)特征因子做歸一化處理,選擇最常用的徑向基核函數(shù),隨機(jī)選取訓(xùn)練集中80%的數(shù)據(jù)作為建模樣本,其余20%作為檢驗(yàn)樣本,使用交叉檢驗(yàn)的方法確定核參數(shù)g=0.28,懲罰因子C=100。
在實(shí)驗(yàn)中,訓(xùn)練數(shù)據(jù)分組包括10 000條有效信息和5 000條虛假信息,檢測(cè)數(shù)據(jù)分組包括3 000條有效信息和1 500條虛假信息。當(dāng)選取不同數(shù)量的警報(bào)信息測(cè)試檢測(cè)開銷和檢測(cè)率時(shí),待檢測(cè)警報(bào)信息中有效信息和虛假信息的比例設(shè)置約為 2∶1。本文方法根據(jù)特征子集1和特征子集2分別檢測(cè)虛假警報(bào)信息時(shí),取兩者中檢測(cè)出的較大的虛假信息數(shù)量求檢測(cè)率。
1)檢測(cè)開銷
檢測(cè)開銷主要衡量待檢測(cè)的警報(bào)信息進(jìn)行檢測(cè)時(shí)所需的檢測(cè)時(shí)間。WCIT方法對(duì)警報(bào)信息的有效特征進(jìn)行分割,多個(gè)特征子集同時(shí)進(jìn)行虛假檢測(cè),故警報(bào)信息的檢測(cè)開銷由需要較長(zhǎng)檢測(cè)開銷的特征子集決定。WCIT方法和BPNN方法的檢測(cè)開銷對(duì)比如圖7所示。

圖7 BPNN與本文方法的檢測(cè)開銷對(duì)比
從圖7中可以看出,當(dāng)檢測(cè)的警報(bào)信息數(shù)量不太多時(shí),2種方法所需的檢測(cè)開銷差別不大。隨著需要檢測(cè)的警報(bào)信息數(shù)量的增加,BPNN方法所需的檢測(cè)時(shí)間逐漸變長(zhǎng),超過(guò)WCIT方法,時(shí)間開銷相比本文方法有越來(lái)越大的趨勢(shì)。這和BPNN方法采用2次過(guò)濾的方式有關(guān)。
2)檢測(cè)率
檢測(cè)率是指檢測(cè)系統(tǒng)能夠正確檢測(cè)出虛假警報(bào)信息的概率。檢測(cè)率越高,說(shuō)明檢測(cè)方法的性能越好。
如圖8所示,隨著檢測(cè)的警報(bào)信息數(shù)目的增加,檢測(cè)率的值呈下降趨勢(shì)。由于使用了綜合特征,WCIT方法的檢測(cè)率優(yōu)于僅使用部分特征的BPNN方法。WCIT方法可以在高密度場(chǎng)景中快速地檢測(cè)出虛假警報(bào)且能夠保證較高的檢測(cè)率。
3)通信開銷
本文設(shè)置新型分組(如表2所示)為警報(bào)信息提供足夠的信息特征。Kim等[14]則采用多源信息檢測(cè)過(guò)濾方法,每個(gè)信息源發(fā)送的分組中,警報(bào)信息僅包含表2中的部分信息特征,要獲取所有信息特征,需接收多個(gè)信息源發(fā)送的事件消息。
表5舉例說(shuō)明本文和文獻(xiàn)[14]的警報(bào)信息分組的發(fā)送情況。其中,警報(bào)數(shù)據(jù)由表2中的信息特征組成。假定警報(bào)數(shù)據(jù)中每個(gè)信息特征所占字節(jié)固定,√ 表示節(jié)點(diǎn)發(fā)送的分組中包含這項(xiàng)特征。節(jié)點(diǎn)1發(fā)送本文設(shè)置的新型分組,一次性發(fā)送的分組包含了所有信息特征。節(jié)點(diǎn)2和節(jié)點(diǎn)3作為文獻(xiàn)[14]中的2種信息源發(fā)送分組,每個(gè)分組包含部分信息特征。由表5可知,本文方法在一次分組發(fā)送中包含的信息特征在文獻(xiàn)[14]方法中需要通過(guò) 2次甚至多次分組發(fā)送才可獲得,由于每個(gè)信息源發(fā)送的分組中存在冗余特征,因而造成通信冗余。當(dāng)需要檢測(cè)大量的警報(bào)信息時(shí),和文獻(xiàn)[14]方法相比,本文方法減少了基于節(jié)點(diǎn)識(shí)別的通信次數(shù),降低了檢測(cè)的整體通信代價(jià)。

圖8 BPNN與本文方法的檢測(cè)率對(duì)比
本文針對(duì)車聯(lián)網(wǎng)中需要快速檢測(cè)大量交通警報(bào)信息提高交通安全的問(wèn)題,提出了一種基于弱分類器集成的虛假交通信息檢測(cè)方法。該方法擴(kuò)充了消息分組的有效特征,并設(shè)計(jì)分割規(guī)則將警報(bào)信息的綜合特征劃分為多個(gè)特征子集;然后,使用適合的弱分類器分別處理;最后,將分類結(jié)果集成來(lái)判斷警報(bào)信息的真實(shí)性。實(shí)驗(yàn)結(jié)果表明,使用弱分類器集成技術(shù)降低了檢測(cè)時(shí)間,且由于綜合特征的應(yīng)用,使本文方案的檢測(cè)率高于使用部分特征的檢測(cè)方案。下一步工作,考慮在警報(bào)信息中設(shè)置更多事件周邊的基礎(chǔ)安全信息,如發(fā)送信息車輛的速度、加速度、方向及車輛上安裝的各種傳感器的感知信息,通過(guò)對(duì)這些人為不可更改的特征信息的分析來(lái)判定事件的真實(shí)性(如震動(dòng)傳感器感知車輛附近是否具有震動(dòng),從而判定是否有事故發(fā)生等),從而減少目前檢測(cè)方法中依靠大量外部數(shù)據(jù)(如 RSU發(fā)送的信息,鄰居車輛發(fā)送的信息)來(lái)檢測(cè)信息的真實(shí)性而帶來(lái)的時(shí)間花費(fèi)和對(duì)數(shù)據(jù)量的依賴性。

表5 警報(bào)信息分組發(fā)送情況
[1]BAIOCCHI A,CUOMO F,FELICE D M,et al. Vehicular ad-hoc networks sampling protocols for traffic monitoring and incident detection in intelligent transportation systems[J]. Transportation Research Part C: Emerging Technologies,2015,56: 177-194.
[2]常促宇,向勇,史美林. 車載自組網(wǎng)的現(xiàn)狀與發(fā)展[J]. 通信學(xué)報(bào),2007,28(11): 116-126.CHANG C Y,XIANG Y,SHI M L. Present situation and development of vehicular ad hoc networks[J]. Journal on Communication,2007,28(11):116-126.
[3]ABUELELA M. A framework for incident detection and notification in vehicular ad-hoc networks[J]. Dissertations amp; Theses-Gradworks,2011.
[4]GROVER J,LAXMI V,GAUR M S. Attack models and infrastructure supported detection mechanisms for position forging attacks in vehicular ad hoc networks[J]. CSI Transactions on Ict,2013,1(3):261-279.
[5]RICHARD G E,MARTINE B,SAMUEL P,et al. VANET security surveys[J]. Computer Communications,2014,44:1-13.
[6]GROVER J,PRAJAPATI N K,LAXMI V,et al. Machine learning approach for multiple misbehavior detection in VANET[M]. Advances in Computing and Communications. Berlin Heidelberg: Springer,2011:644-653.
[7]ZHU W T,ZHOU J,DENG R H,et al. Detecting node replication attacks in wireless sensor networks: a survey[J]. Journal of Network and Computer Applications,2012,35(3): 1022-1034.
[8]ABDELAZIZ K C,LAGRAA N,LAKAS A. Trust model with delayed verification for message relay in VANETs[C]//The 2014 International Conference on Wireless Communications and Mobile Computing(IWCMC’14). c2014: 700-705.
[9]DING Q,LI X,JIANG M et al. Reputation-based trust model in vehicular ad hoc networks[C]//The 2010 International Conference on Wireless Communications and Signal Processing (WCSP’14),Suzhou.c2010: 1 - 6.
[10]ZHANG J,CHEN C,COHEN R. Trust modeling for message relay control and local action decision making in VANETs[J]. Security amp;Communication Networks,2013,6(6):1-14.
[11]SHAIKH R A,ALZAHRANI A S. Intrusion-aware trust model for vehicular ad hoc networks[J]. Security amp; Communication Networks,2014,7(11):1652–1669.
[12]OSTERMAIER B,DOTZER F,STRASSBERGER M. Enhancing the security of local danger warnings in VANETs-a simulative analysis of voting schemes[C]//The 2nd International Conference on Availability,Reliability and Security. c2007:422-431.
[13]李春彥,劉怡良,王良民. 車載自組網(wǎng)中基于交通場(chǎng)景的入侵行為檢測(cè)機(jī)制[J]. 山東大學(xué)學(xué)報(bào),2014,44 (1): 29-34.LI C Y,LIU Y L,WANG L M. Intrusion detection scheme based on traffic scenarios in vehicular ad-hoc networks[J]. Journal of Shandong University,2014,44(1):29-34.
[14]KIM T H J,STUDER A,DUBEY R,et al. VANET alert endorsement using multi-source filters[C]//The 7th ACM International Workshop on Vehicular Ad Hoc Networks. c2010:51-60.
[15]ZHANG J Y,HUANG L X,XU M J,et al. An incremental BP neural network based spurious message filter for VANET[C]//The 2012 International Conference on Cyber-Enabled Distributed Computing and Knowledge Discovery(CyberC’12). Sanya,c2012: 360-367.
[16]LIM S,HUIE L. Hop-by-hop cooperative detection of selective forwarding attacks in energy harvesting wireless sensor networks[C]//The 2015 IEEE International Conference on Computing,Networking and Communications (ICNC’2015). c2015: 315-319.
[17]詹珂昕. 高速公路VANET預(yù)警信息傳播機(jī)制的研究[D]. 北京: 北京交通大學(xué),2012.ZHAN K X. Propagation mechanism of highway safety warning message based on VANET[D]. Beijing: Beijing Jiaotong University,2012.
False traffic information detection based on weak classifiers integration in vehicular ad hoc networks
LIU Xiang-wen1,SHI Ya-li1,FENG Xia2
(1. School of Computer Science and Communication Engineering,Jiangsu University,Zhenjiang 212013,China;2. Information Assurance Technology Collaborative Innovation Center,Anhui University,Hefei 230000,China)
Vehicles report traffic information mutually by self-organized manner in vehicular ad hoc networks (VANET),and the message need to be identified in the open network environment. However,it is very difficult for fast moving vehicles to detect a lot of traffic alert information in a short time. To solve this problem,a false traffic message detection method was presented based on weak classifiers integration. Firstly,the effective features of traffic alert information was extended and segmentation rules were designed to divide the information feature set into multiple feature subsets,then the corresponding weak classifiers were used to process feature subsets respectively according to the different characteristics of the subsets’ features. Simulation experiments and performance analysis show that the selected weak classifiers integration method reduces the detection time,and because of the application of combined features,the detection rate is better than the test of using only some of the characteristics.
VANET,false information detection,weak classifiers integration,BP neural network
s:The National Natural Science Foundation of China (No.61472001),The Natural Science Foundation of Jiangsu Province (No.BK2011464),Blue Project of Jiangsu Province,Zhenjiang City Industrial Support Project(No.GY2013030)
TP393
A
2015-11-09;
2016-07-04
國(guó)家自然科學(xué)基金資助項(xiàng)目(No.61472001);江蘇省自然科學(xué)基金資助項(xiàng)目(No.BK2011464);江蘇省青藍(lán)工程基金資助項(xiàng)目;鎮(zhèn)江市工業(yè)支撐基金資助項(xiàng)目(No.GY2013030)
10.11959/j.issn.1000-436x.2016156

劉湘雯(1979-),女,江蘇宜興人,江蘇大學(xué)講師,主要研究方向?yàn)檐嚶?lián)網(wǎng)與大數(shù)據(jù)安全、隱私保護(hù)。

石亞麗(1992-),女,安徽蕪湖人,江蘇大學(xué)碩士生,主要研究方向?yàn)檐嚶?lián)網(wǎng)安全。

馮霞(1983-),女,江蘇揚(yáng)中人,安徽大學(xué)博士生,主要研究方向?yàn)檐嚶?lián)網(wǎng)與交通大數(shù)據(jù)安全。