郭 城,姚保峰,蔡紹峰
(蚌埠學(xué)院 計(jì)算機(jī)與信息工程學(xué)院,安徽 蚌埠 233000)
歐盟發(fā)布的一項(xiàng)數(shù)據(jù)顯示,交通事故已經(jīng)超過戰(zhàn)爭(zhēng)成為僅次于疾病的第二大致死因素。對(duì)引發(fā)交通事故的原因進(jìn)行分析,我們可以發(fā)現(xiàn)導(dǎo)致交通事故的因素有兩類,一類為外部因素,如路況、車況、天氣因素等;另一類為駕駛員自身的主客觀因素,如酒駕、毒駕、開車不專心、過度疲勞等。在這兩類因素中,后者是主要的因素,因?yàn)橛谐^一半的事故是駕駛員分心造成的。如果有一種方法能夠監(jiān)測(cè)駕駛員是否存在分心駕駛的行為并作出預(yù)警,那么交通事故也一定會(huì)明顯下降。將現(xiàn)代技術(shù)手段應(yīng)用于駕駛員駕駛狀態(tài)監(jiān)測(cè),將成為保障駕乘人員人身和財(cái)產(chǎn)安全的重要手段。
分心駕駛是一種非常危險(xiǎn)并極易造成車毀人亡的危險(xiǎn)行為,被多個(gè)國(guó)家列為引發(fā)交通事故的常見因素。隨著各種新穎有趣的車載多媒體設(shè)備的應(yīng)用與更新,分心駕駛問題越來越嚴(yán)重,因此,研究駕駛員分心駕駛行為監(jiān)測(cè)技術(shù),并對(duì)駕駛員及時(shí)進(jìn)行提醒很有必要。
學(xué)術(shù)界迄今尚無一致的分心駕駛定義。當(dāng)前學(xué)術(shù)界一般采用澳大利亞道委會(huì)提出的定義,即將分心駕駛定義為在排除酒精、疲勞、藥物等因素的情況下,駕駛員自主或非自主地把注意力從駕駛?cè)蝿?wù)上轉(zhuǎn)移到能夠造成駕駛技能及預(yù)判能力降低的非駕駛?cè)蝿?wù)上。換言之,分心駕駛是駕駛員在主客觀因素作用下進(jìn)入的一種不集中注意力的狀態(tài)。根據(jù)分心產(chǎn)生的原因,通常將分心駕駛行為分為三種,一種是因駕駛員的非駕駛動(dòng)作,如將手從方向盤上移開造成的分心,被稱為操作分心,最典型的表現(xiàn)是開車打電話等;一種是駕駛員的視線偏離或離開汽車的前進(jìn)方向的分心,被稱為視覺分心,這種分心會(huì)導(dǎo)致駕駛員反應(yīng)時(shí)間變長(zhǎng)和車輛偏離正常行駛路線,最典型的表現(xiàn)為開車看手機(jī)、調(diào)節(jié)車載多媒體設(shè)備等動(dòng)作;一種是駕駛員的思維判斷能力不能完全集中在操控汽車行駛主任務(wù)的分心,被稱為認(rèn)知分心,這種分心會(huì)導(dǎo)致駕駛員的注意力下降,大腦判斷能力遲鈍,降低駕駛?cè)藛T對(duì)車輛周圍情況的監(jiān)測(cè)能力,最典型的表現(xiàn)是駕駛員開車時(shí)說話、思考其他問題等。值得注意的是,這三種分心在日常駕駛中并不是單獨(dú)出現(xiàn)的,很多時(shí)候是成對(duì)出現(xiàn)的,如駕駛中的打電話行為,手拿話機(jī)會(huì)致操作分心,講話時(shí)會(huì)占用大腦的一部分思維資源而造成認(rèn)知分心。
如前所述,當(dāng)駕駛員進(jìn)入分心狀態(tài)后,會(huì)出現(xiàn)足以影響駕乘人員人身安全的注意力轉(zhuǎn)移狀態(tài),其本質(zhì)是駕駛員將部分或者全部注意力分散到駕駛的次任務(wù)上,進(jìn)而影響駕駛的主任務(wù)動(dòng)作,并由此產(chǎn)生一些駕駛員外在的生理表現(xiàn)和車輛行駛軌跡變化。據(jù)此可知,分心駕駛的監(jiān)測(cè)應(yīng)圍繞駕駛員外在生理表現(xiàn)和車輛行駛軌跡變化的監(jiān)測(cè)進(jìn)行。這些外在的表現(xiàn)可以分為駕駛員生理信號(hào)的特征表現(xiàn)、駕駛員的外在特征表現(xiàn)、車輛行駛特征表現(xiàn)等。根據(jù)這些外在的特征表現(xiàn),分心駕駛監(jiān)測(cè)技術(shù)分為直接監(jiān)測(cè)和間接監(jiān)測(cè)。
間接監(jiān)測(cè)是指運(yùn)用多種傳感器對(duì)車輛的行駛狀態(tài)特征進(jìn)行監(jiān)測(cè),而不是直接進(jìn)行駕駛員狀態(tài)數(shù)據(jù)的獲取,如監(jiān)測(cè)車輛行駛時(shí)的速度、軌跡、加速度、相對(duì)位置和司機(jī)在方向盤上的抓握力等,以此來判定駕駛員的狀態(tài)。駕駛員操控汽車的動(dòng)作行為會(huì)直接反映在汽車的行駛狀態(tài)上,如果駕駛員出現(xiàn)分心的話其操控行為會(huì)導(dǎo)致汽車行駛狀態(tài)的改變,通過監(jiān)測(cè)這些改變就能夠判斷出駕駛員當(dāng)時(shí)所處的狀態(tài)。文獻(xiàn)[1]通過駕駛模擬器進(jìn)行認(rèn)知分心對(duì)車輛操控影響實(shí)驗(yàn),結(jié)果表明方向盤轉(zhuǎn)動(dòng)角變化的頻率與認(rèn)知分心程度為正相關(guān);油門開度,制動(dòng)踏板位置均值和方差,加速度標(biāo)準(zhǔn)差等參數(shù)在駕駛員處于認(rèn)知分心狀態(tài)時(shí)均變大,導(dǎo)致跟車穩(wěn)定性降低。
間接監(jiān)測(cè)的優(yōu)點(diǎn)是可以在不接觸駕駛員的情況下進(jìn)行監(jiān)測(cè),對(duì)駕駛員駕駛汽車不產(chǎn)生影響。同時(shí)這種監(jiān)測(cè)方式所需要的傳感器一般較為常見,可以有效控制監(jiān)測(cè)成本。但這種方法也存在一定不足,主要是受車輛狀況、司機(jī)操作習(xí)慣等因素的影響較大,監(jiān)測(cè)結(jié)果的準(zhǔn)確性還有待進(jìn)一步提升。另外,目前在間接監(jiān)測(cè)方法研究中采集的樣本數(shù)據(jù)不夠豐富,研究方法有待改進(jìn)。
直接監(jiān)測(cè)是指利用多種傳感器,或者運(yùn)用AI算法直接獲取駕駛員本人狀態(tài)數(shù)據(jù)的監(jiān)測(cè)。現(xiàn)階段的直接監(jiān)測(cè)技術(shù)主要圍繞駕駛員生理參數(shù)、視覺特征和機(jī)器視覺特征等方面進(jìn)行。
2.2.1 基于駕駛員生理參數(shù)的監(jiān)測(cè)技術(shù)
這類監(jiān)測(cè)技術(shù)需要使用專門的設(shè)備來監(jiān)測(cè)駕駛員心電信號(hào)、腦電波信號(hào)、肌電信號(hào)、大腦皮層激活信號(hào)等生理參數(shù),然后提取參數(shù)中的特征進(jìn)行統(tǒng)計(jì)分析并與正常狀態(tài)下的駕駛參數(shù)進(jìn)行對(duì)比分析,進(jìn)而得出駕駛員是否處在分心狀態(tài)的結(jié)論。例如,趙國(guó)朕在駕駛模擬器上提取了駕駛員在認(rèn)知分心狀態(tài)下和正常駕駛狀態(tài)下的腦電信號(hào),通過研究分析得出從腦頂葉采集的信號(hào)中Beta波與Alpha波的比值能夠很好地區(qū)分出正常駕駛與認(rèn)知分心駕駛狀態(tài)的結(jié)論,并利用機(jī)器學(xué)習(xí)算法搭建了能夠?qū)φJ(rèn)知造成的分心駕駛進(jìn)行識(shí)別的模型,其準(zhǔn)確率高達(dá)80%以上[2]。此種方法一般采取接觸式的方式進(jìn)行駕駛員生理參數(shù)的獲取,所以穩(wěn)定性和準(zhǔn)確性都比較高。但此種方法也存在著一些不足,一是所需的采集設(shè)備一般較大且價(jià)格不菲,經(jīng)濟(jì)性不高;二是現(xiàn)階段對(duì)于這種方法的研究大多采用的是模擬器數(shù)據(jù),實(shí)車數(shù)據(jù)較少;三是接觸性采集設(shè)備工作時(shí)可能會(huì)影響到正常駕駛。
2.2.2 基于駕駛員視覺特征的監(jiān)測(cè)技術(shù)
視覺是人們獲取周圍環(huán)境信息最為重要的方式之一,特別是對(duì)于司機(jī)這一特定人群來說獲取道路、車況等信息的唯一方式就是眼睛。據(jù)研究,駕駛員在駕駛汽車時(shí)視覺信息源提供的信息量占據(jù)了所有信息量的80%[3]。閉眼、眨眼、掃視、注視等眼部動(dòng)作統(tǒng)稱為眼動(dòng)行為,根據(jù)這些行為研究人員又設(shè)定了相應(yīng)的眼動(dòng)參數(shù)。例如,掃視的左右擺幅大小以及時(shí)長(zhǎng)、注視的持續(xù)時(shí)間、瞳孔面積的占比、眼瞼閉合時(shí)間、眨眼次數(shù)等。周揚(yáng)等提出了一種能判定認(rèn)知分心的模型,他們運(yùn)用隨機(jī)森林算法分析了模擬駕駛器上采集來的駕駛員眨眼時(shí)間、注視時(shí)長(zhǎng)兩個(gè)指標(biāo),通過模擬駕駛試驗(yàn)得出隨著認(rèn)知分心的增強(qiáng),眨眼時(shí)長(zhǎng)會(huì)增加、注視時(shí)長(zhǎng)會(huì)減少,模型的平均識(shí)別率為83.69%的結(jié)論[4]。對(duì)駕駛員眼動(dòng)特征的追蹤、獲取、判定是基于視覺特征監(jiān)測(cè)技術(shù)的核心要素,此種方法通常通過眼動(dòng)儀來獲取駕駛?cè)说难蹌?dòng)特征數(shù)據(jù),對(duì)分心駕駛的判別率較高。但此種方式也存在著以下幾個(gè)方面的問題:一是魯棒性不高,如駕駛員戴墨鏡的情況下就無法對(duì)眼動(dòng)特征進(jìn)行監(jiān)測(cè)獲取;二是因眼動(dòng)特征較多,運(yùn)用此種方法去判別分心的指標(biāo)尚不統(tǒng)一,且各種指標(biāo)的閾值也未確定;三是當(dāng)前研究多利用人工干預(yù)的方法讓駕駛員進(jìn)入分心狀態(tài),然后再進(jìn)行數(shù)據(jù)的獲取,這種強(qiáng)制分心模式下的數(shù)據(jù)難免會(huì)與真實(shí)駕駛狀態(tài)下的分心過程存在差異。
2.2.3 基于機(jī)器視覺特征的監(jiān)測(cè)技術(shù)
機(jī)器視覺特征監(jiān)測(cè)技術(shù)是指根據(jù)攝像頭拍攝的駕駛員圖像信息,運(yùn)用圖像處理算法,來判定駕駛員的狀態(tài)是否處于分心之中的監(jiān)測(cè)技術(shù)。這種方法一般分為兩個(gè)過程塊,一個(gè)是訓(xùn)練過程塊,另一個(gè)是測(cè)試過程塊。訓(xùn)練過程塊中先是對(duì)攝像頭采集的圖像數(shù)據(jù)進(jìn)行濾波、去除噪聲等的預(yù)處理,隨后提取圖像的特征,最后把提取到的特征運(yùn)用SVM、K-means等聚類算法進(jìn)行分類識(shí)別訓(xùn)練。測(cè)試過程塊是利用訓(xùn)練好的模型,在測(cè)試集上進(jìn)行測(cè)試得出最終結(jié)果。卜慶志等在研究中首先對(duì)獲取的圖像進(jìn)行預(yù)處理(去噪、增強(qiáng)、歸一化),隨后利用梯度直方圖(HOG)和支持向量機(jī)(SVM)構(gòu)建了一種駕駛員行為監(jiān)測(cè)算法,進(jìn)行駕駛員行為監(jiān)測(cè)[5]。
近年來在AI圖像處理領(lǐng)域又出現(xiàn)了一道新的曙光——深度學(xué)習(xí),圖像處理領(lǐng)域卷積神經(jīng)網(wǎng)絡(luò)算法的精度和魯棒性不斷提高,這為基于機(jī)器視覺特征的駕駛員分心監(jiān)測(cè)技術(shù)帶來了新的方向。陳軍等提出了一種改進(jìn)型的CNN分心監(jiān)測(cè)模型,先用輕型CNN網(wǎng)絡(luò)進(jìn)行原始圖像篩查,再用VGG進(jìn)行精確識(shí)別,準(zhǔn)確率達(dá)到93.3%[6]。Baheti等在研究中不僅關(guān)注卷積神經(jīng)網(wǎng)絡(luò)的精確度,同時(shí)還關(guān)注了網(wǎng)絡(luò)在存儲(chǔ)和速度方面的效率問題,他們利用谷歌公司提出的深度可分離卷積核,構(gòu)建了名為MobileVGG的一種新體系結(jié)構(gòu),其模型僅有2.2M的參數(shù),在AUC和Statefarm數(shù)據(jù)集上分別達(dá)到了95.24%和99.75%的精度,而計(jì)算復(fù)雜度和內(nèi)存需求卻更低[7]。Moslemi在研究中考慮了時(shí)間維度信息,使用3D卷積神經(jīng)網(wǎng)絡(luò)與光流法來改善駕駛員分心監(jiān)測(cè),分別在光流輸入和RGB輸入上訓(xùn)練了兩個(gè)3D網(wǎng)絡(luò),判斷駕駛員的分心狀態(tài)[8]。
因深度學(xué)習(xí)算法在分心監(jiān)測(cè)領(lǐng)域有著更高的魯棒性和準(zhǔn)確性,所以機(jī)器視覺特征的監(jiān)測(cè)技術(shù)主要研究方向在深度學(xué)習(xí)。但現(xiàn)階段使用深度學(xué)習(xí)進(jìn)行分心監(jiān)測(cè)的算法還存在著一些問題:①現(xiàn)階段用于訓(xùn)練模型的數(shù)據(jù)集都只包含了特定的一些分心動(dòng)作,而在真實(shí)環(huán)境中駕駛員分心駕駛的行為多種多樣,這就導(dǎo)致出現(xiàn)開放集識(shí)別的問題;②模型設(shè)計(jì)出來后需要大量的訓(xùn)練,其過程較為繁雜;③模型運(yùn)行時(shí)占用的機(jī)器運(yùn)行資源較多,而在汽車上的機(jī)器多為資源受限的嵌入式設(shè)備,難以在真實(shí)環(huán)境中應(yīng)用;④大部分研究仍停留在使用傳統(tǒng)的CNN結(jié)構(gòu)上,這種結(jié)構(gòu)只能分析靜態(tài)的單張圖片,而駕駛員的分心行為是一個(gè)動(dòng)態(tài)變化的過程,大部分模型無法使用輸入模型的前后信息進(jìn)行分心監(jiān)測(cè),這會(huì)導(dǎo)致漏檢、錯(cuò)檢的問題。
分心駕駛一直是導(dǎo)致交通事故發(fā)生的主要原因之一,隨著車內(nèi)多媒體設(shè)備的多樣化,分心駕駛現(xiàn)象有逐漸增多的趨勢(shì)。國(guó)內(nèi)外針對(duì)駕駛員分心行為監(jiān)測(cè)的主要方法有兩類,雖然這兩類方法都有各自的優(yōu)勢(shì),但也各有局限性,監(jiān)測(cè)的精度和魯棒性都有待提高。
從本文研究可以得到以下結(jié)論:在不同的監(jiān)測(cè)技術(shù)中,用于識(shí)別分心的參數(shù)及其閾值尚未統(tǒng)一,駕駛員的分心程度還需劃分,國(guó)內(nèi)外尚未形成一套科學(xué)的評(píng)價(jià)體系為分心駕駛的監(jiān)測(cè)與預(yù)警,為運(yùn)用自動(dòng)駕駛技術(shù)自動(dòng)接管分心中的駕駛員等提供參考。同時(shí)也可以發(fā)現(xiàn)以下趨勢(shì):①分心駕駛的研究應(yīng)該從預(yù)防、監(jiān)測(cè)、解除三個(gè)方面同時(shí)進(jìn)行,而現(xiàn)階段研究較多關(guān)注監(jiān)測(cè),對(duì)分心的預(yù)防和解除的研究將是今后的重要方向。②現(xiàn)階段各種監(jiān)測(cè)技術(shù)的準(zhǔn)確性、魯棒性和監(jiān)測(cè)模型效率還有進(jìn)一步提高的潛力,可以更多采用多證據(jù)源信息融合監(jiān)測(cè)法,如融合車輛的行駛狀態(tài)特征和駕駛員的眼動(dòng)特征、融合機(jī)器視覺特征與車輛行駛狀態(tài)特征等進(jìn)行監(jiān)測(cè)。③機(jī)器視覺監(jiān)測(cè)研究將是今后研究的熱門領(lǐng)域,一是要關(guān)注對(duì)現(xiàn)有模型的剪枝、壓縮和提高訓(xùn)練效率,使其能部署在車內(nèi)的嵌入式設(shè)備中;二是要考慮利用輸入模型數(shù)據(jù)的上下文信息綜合判斷分心的狀態(tài),目前出現(xiàn)了針對(duì)分心駕駛監(jiān)測(cè)的3D結(jié)構(gòu)CNN網(wǎng)絡(luò),但其網(wǎng)絡(luò)參數(shù)規(guī)模相比原有CNN的規(guī)模龐大許多,而且3D卷積神經(jīng)網(wǎng)絡(luò)只能處理固定時(shí)長(zhǎng)的視頻,忽略了時(shí)間維度結(jié)構(gòu)的問題,還有較大發(fā)展空間。④現(xiàn)有監(jiān)測(cè)技術(shù)中多缺少針對(duì)實(shí)車駕駛數(shù)據(jù)的分析,訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的分心駕駛數(shù)據(jù)集仍需加強(qiáng)。