






摘要:“團霧”是一種突發(fā)性強、能見度極低的惡劣氣象現(xiàn)象,常見于高速公路路段。通過研究\"團霧\"檢測方法,可以有效進行預(yù)警,減少由“團霧”引發(fā)的交通事故,并為自動駕駛技術(shù)提供關(guān)鍵的環(huán)境感知技術(shù)支持。因此,本研究提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)(CNN) 和支持向量機(SVM) 的“團霧”檢測方法。該方法保留了CNN在特征提取方面的優(yōu)勢,同時引入了SVM在分類任務(wù)上的強大性能,用SVM替代SoftMax分類器進行“團霧”圖像的分類。通過對準(zhǔn)確率、精確率、召回率和F1值的綜合評估,驗證了本研究改進的算法在高速公路“團霧”檢測性能上有顯著提升,為智慧警務(wù)提供了有價值的借鑒,并更好地應(yīng)用于公安實戰(zhàn)中。
關(guān)鍵詞:高速公路“團霧”;“團霧”檢測方法;卷積神經(jīng)網(wǎng)絡(luò);支持向量機;智慧警務(wù)
中圖分類號:TP311" "文獻標(biāo)識碼:A
文章編號:1009-3044(2025)08-0001-04
開放科學(xué)(資源服務(wù)) 標(biāo)識碼(OSID) :
0" 引言
隨著我國高速公路交通網(wǎng)絡(luò)的不斷建設(shè)和發(fā)展,車輛行駛安全問題日益突出。深入研究“團霧”檢測方法,對于提升國家智能交通系統(tǒng)的安全性和運行效率具有重要意義。
“團霧”檢測技術(shù)受到了國內(nèi)外學(xué)者的廣泛關(guān)注。在深度學(xué)習(xí)技術(shù)的推動下,國內(nèi)研究者金小飛[1]深入研究了智慧高速公路場景中的“團霧”檢測技術(shù)。他們運用卷積神經(jīng)網(wǎng)絡(luò)(CNN) 對霧天公路視頻圖像進行霧濃度級別的精準(zhǔn)分類,創(chuàng)新性地結(jié)合了ResNet50和VGG16卷積網(wǎng)絡(luò),并引入自適應(yīng)模塊,顯著提升了模型的收斂速度和識別精度,實現(xiàn)了對五個級別能見度的穩(wěn)定識別,準(zhǔn)確率均超過0.8。
王琦[2]等人提出了一種基于時間序列圖像處理技術(shù)的“團霧”檢測方法。他們從大量視頻監(jiān)控數(shù)據(jù)中提取信息,運用高斯混合模型獲取背景序列圖像,通過觀察圖像的對比度、灰度值及邊緣特性,研究“團霧”產(chǎn)生時背景像素的變化趨勢,并將這些特性值與能見度匹配,構(gòu)建基于背景像素序列的能見度模型,比較相鄰攝像頭的數(shù)據(jù)以確定“團霧”的存在。
劉建磊[3]等人提出了一種利用彩色視頻圖像對比度模型和支持向量機區(qū)分“團霧”的檢測算法。常榮[4]等人則提出了一種利用混合特征向量矩和SoftMax分類器對“團霧”圖像進行分類的算法,通過優(yōu)化訓(xùn)練后的分類器,實現(xiàn)對“團霧”圖像的精準(zhǔn)分類。
在國際上,早期研究已開始關(guān)注利用固定目標(biāo)物的視頻圖像進行能見度檢測。例如,李靜[5]等人通過分析目標(biāo)物亮度與距離的關(guān)系,成功實現(xiàn)了能見度的檢測。KIM Y H[6]等人利用數(shù)碼全景攝像機拍攝的時間序列圖像,檢測最遠目標(biāo)物以估算氣象能見度。Li LI L L[7]等人提出了一種用于圖像“團霧”檢測的淺層卷積神經(jīng)網(wǎng)絡(luò),詳細設(shè)計了網(wǎng)絡(luò)的框架和各組成部分。
1 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN) 在深度學(xué)習(xí)領(lǐng)域占據(jù)了重要地位。CNN的局部連接和權(quán)重共享等特性,使其具備平移、縮放和旋轉(zhuǎn)等不變性,從而大大減少了模型的參數(shù)量[8-10]。本研究利用CNN構(gòu)建“團霧”檢測識別系統(tǒng),這對于“團霧”檢測具有重大意義。CNN的優(yōu)勢主要體現(xiàn)在以下幾個方面:
1) 無須復(fù)雜預(yù)處理。CNN可直接對原始輸入數(shù)據(jù)進行表征學(xué)習(xí),無需進行去噪等預(yù)處理步驟。
2) 多層次特征提取。CNN能夠從低級到高級提取特征,實現(xiàn)目標(biāo)的全面表示。
3) 參數(shù)共享與稀疏連接。卷積核參數(shù)共享和層間連接的稀疏性大大降低了模型參數(shù)量,減少了過擬合風(fēng)險。
4) 端到端學(xué)習(xí)。CNN采用“端到端”學(xué)習(xí)方式,輸入數(shù)據(jù)信息后,根據(jù)任務(wù)需求直接輸出預(yù)測結(jié)果。
1.1 卷積層
卷積層的核心功能在于多維特征信息的精準(zhǔn)提取。每個卷積層由多個神經(jīng)元組成,每個神經(jīng)元與前一層中相鄰的多個神經(jīng)元相互連接,形成所謂的“感受野”。感受野的大小由卷積核的尺寸決定。卷積核在輸入圖像上有序地滑動,有效捕捉局部信息。卷積層的關(guān)鍵參數(shù)包括卷積核大小、步長和填充層數(shù),這些參數(shù)的優(yōu)化配置對提升模型性能至關(guān)重要。
1.2 激活函數(shù)
激活函數(shù)是非線性映射層的關(guān)鍵組成部分。其引入顯著增強了網(wǎng)絡(luò)的非線性建模能力,使網(wǎng)絡(luò)能夠表達更復(fù)雜的映射關(guān)系,從而提升網(wǎng)絡(luò)的表征能力。
1.3 池化層
池化層的主要功能是簡化卷積層輸出的特征信息。在保持原有重要特征信息空間不變性的基礎(chǔ)上,池化層實現(xiàn)了特征數(shù)量的顯著減少,進而有效減少了網(wǎng)絡(luò)參數(shù)量。池化操作使模型更關(guān)注于特征的存在性而非具體位置,賦予特征一定的不變性。圖1展示了池化操作的整個流程,池化層內(nèi)無參數(shù)。
在圖1中,對于一個4×4的特征圖,采用2×2的濾波器,步長(stride) 為2,無填充(padding) 進行池化操作。最大池化選擇2×2區(qū)域內(nèi)的最大激活值;均值池化則計算每個2×2區(qū)域內(nèi)神經(jīng)元激活值的平均值。通常,濾波器大小為2×2,步長為2。
1.4 全連接層
全連接層(fully-connected layer) 通常出現(xiàn)在模型的后幾層,充當(dāng)“分類器”的角色。全連接層存在一些局限性:1) 輸入尺寸固定。全連接層要求輸入圖像的尺寸固定。2) 參數(shù)量大。隨著網(wǎng)絡(luò)深度增加,全連接層的參數(shù)數(shù)量急劇增加,容易導(dǎo)致過擬合并增加計算成本。3) 空間結(jié)構(gòu)破壞。全連接層直接將三維特征圖拉平處理,破壞了特征的原始空間結(jié)構(gòu)。
為克服這些不足,全連接層可由1×1的卷積操作替代,以保留特征的原始空間結(jié)構(gòu)。同時,全局平均池化(Global Average Pooling, GAP) 也是一種有效的替代方案,它支持任意大小的圖像輸入,參數(shù)量少,有助于避免過擬合并減少計算量。
1.5 輸出層
輸出層與最后一層全連接層緊密相連,通常采用歸一化指數(shù)函數(shù)(softmax function) 或邏輯函數(shù)來輸出分類標(biāo)簽,因此也被稱為softmax層。
2 基于CNN-SVM的“團霧”檢測方法
2.1 支持向量機(SVM) 分類器
支持向量機(SVM) 是一種強大的監(jiān)督學(xué)習(xí)算法,廣泛應(yīng)用于分類和回歸分析任務(wù)中。在“團霧”圖像檢測領(lǐng)域,SVM通過訓(xùn)練能夠檢測圖像中的關(guān)鍵特征,實現(xiàn)“團霧”與“非團霧”圖像的準(zhǔn)確區(qū)分。
1) 特征提取。在應(yīng)用SVM進行“團霧”圖像檢測之前,特征提取是關(guān)鍵的預(yù)處理步驟。此步驟涉及從“團霧”圖像中提取能夠表征其獨特屬性的關(guān)鍵特征,例如顏色直方圖、紋理特征和形狀描述符。通過提取這些特征,可以顯著提高SVM模型對“團霧”圖像的識別準(zhǔn)確性。
2) 核技巧。SVM的核技巧是一種高級技術(shù),允許算法在高維空間中自動尋找最優(yōu)超平面,而無需顯式地將輸入特征映射到高維空間。根據(jù)不同任務(wù)需求和數(shù)據(jù)特性,選擇合適的核函數(shù)可以優(yōu)化SVM模型的性能。
3) 模型訓(xùn)練與驗證。為了訓(xùn)練一個性能優(yōu)良的SVM模型,需要使用帶有標(biāo)簽的“團霧”與“非團霧”圖像數(shù)據(jù)集。通過這些數(shù)據(jù)集,SVM可以學(xué)習(xí)如何根據(jù)圖像特征進行分類。訓(xùn)練完成后,通過交叉驗證等方法評估模型的泛化能力,確保模型在實際應(yīng)用中的實用性。
2.2 卷積神經(jīng)網(wǎng)絡(luò)模型設(shè)計
為了有效檢測“團霧”圖像,本文設(shè)計了一個專門的卷積神經(jīng)網(wǎng)絡(luò)(CNN) 模型。該模型旨在捕捉圖像中的局部特征,并逐層構(gòu)建更為復(fù)雜和抽象的特征表示。
1) 網(wǎng)絡(luò)架構(gòu)。CNN作為深度學(xué)習(xí)模型,特別適用于處理圖像數(shù)據(jù)。設(shè)計一個適用于“團霧”圖像檢測的CNN模型,需要考慮如何有效地捕捉局部特征,并通過多層次的網(wǎng)絡(luò)結(jié)構(gòu)構(gòu)建高級特征表示。
2) 卷積層。卷積層負責(zé)提取圖像中的局部特征。通過使用多個卷積核,網(wǎng)絡(luò)可以學(xué)習(xí)到不同的特征,如邊緣、紋理等。這些特征是后續(xù)分類任務(wù)的基礎(chǔ)。
3) 池化層。池化操作通常緊跟在卷積層之后,用于降低特征的空間維度,從而減少計算量。同時,池化使特征檢測更加魯棒,增強模型的泛化能力。
4) 全連接層。在網(wǎng)絡(luò)的深層,卷積層的輸出被展平并通過全連接層,生成用于分類的高維特征向量。全連接層將學(xué)習(xí)到的特征映射到樣本標(biāo)記空間。
5) 激活函數(shù)。如ReLU(Rectified Linear Unit) 激活函數(shù),能夠在網(wǎng)絡(luò)中引入非線性,使模型能夠?qū)W習(xí)更復(fù)雜的特征。ReLU激活函數(shù)的使用能夠賦予網(wǎng)絡(luò)一定的稀疏性,減少參數(shù)間的相互影響,有助于緩解過擬合現(xiàn)象。
6) 損失函數(shù)與優(yōu)化器。選擇合適的損失函數(shù)和優(yōu)化算法(如Adam) 對于網(wǎng)絡(luò)的訓(xùn)練至關(guān)重要。損失函數(shù)用于衡量預(yù)測誤差,優(yōu)化器則用于最小化損失,提高網(wǎng)絡(luò)的性能。
7) 數(shù)據(jù)增強。為了提高模型的泛化能力,采用數(shù)據(jù)增強技術(shù),如旋轉(zhuǎn)、縮放和裁剪,豐富訓(xùn)練數(shù)據(jù)的多樣性,防止模型過擬合。
8) 模型調(diào)優(yōu)。通過調(diào)整網(wǎng)絡(luò)的深度、卷積核的數(shù)量和大小、池化層的策略等,進行模型調(diào)優(yōu),以達到最佳的識別效果。
9) 性能評估。使用測試集評估CNN模型的性能,關(guān)注精確率、準(zhǔn)確率、召回率和F1分數(shù)等指標(biāo),確保模型在實際應(yīng)用中的有效性。
2.3 基于CNN-SVM的“團霧”圖像檢測與分類流程
本研究所構(gòu)建的CNN-SVM網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。其中,C1和C2代表卷積層,P1和P2代表池化操作,F(xiàn)C代表全連接操作。
基于CNN-SVM的“團霧”圖像檢測與分類流程如下。
1) 數(shù)據(jù)輸入。將“團霧”圖像數(shù)據(jù)有效傳輸至系統(tǒng)輸入層,為后續(xù)處理奠定基礎(chǔ)。
2) 特征提取與轉(zhuǎn)換。圖像數(shù)據(jù)通過設(shè)計精良的CNN進行深度處理,利用卷積和池化操作精準(zhǔn)提取關(guān)鍵特征。隨后,這些特征通過全連接層高效轉(zhuǎn)換,映射為一維數(shù)據(jù)格式,便于后續(xù)分類器處理。
3) SVM分類器輸入。將全連接層輸出的一維數(shù)據(jù)無縫對接至支持向量機(SVM) 分類器,利用SVM強大的分類能力進行進一步分析。
4) 分類結(jié)果輸出。經(jīng)過SVM分類器的精準(zhǔn)計算與判定,最終得出“團霧”圖像的分類結(jié)果,實現(xiàn)高效、準(zhǔn)確的圖像檢測與分類流程。
3 實驗設(shè)計
3.1 數(shù)據(jù)集
目前尚無公開的“團霧”圖像可供使用,因此,本研究的數(shù)據(jù)主要來源于視頻提取及網(wǎng)絡(luò)爬取“團霧”圖像。為確保數(shù)據(jù)質(zhì)量,采用了人工篩選的方式,將不符合條件的圖像剔除,獲得了“團霧”天氣圖像和正常天氣圖像各250張,共計500張圖像。圖3展示了本實驗數(shù)據(jù)集中部分“團霧”天氣圖像。為了確保數(shù)據(jù)的統(tǒng)一性和標(biāo)準(zhǔn)化,所有圖像均被調(diào)整為30×30像素,并以JPG格式存儲,其中訓(xùn)練集350張(“團霧”175張,正常天氣175張) ,測試集150張(“團霧”75張,正常天氣75張) 。
3.2 實驗環(huán)境
本實驗的操作系統(tǒng)為 Ubuntu 16.04,GPU為NVIDIA GTX 2080Ti * 1,CPU為Inter(R) Xeon(R) E5-2620 v4,內(nèi)存 9 GB,Python 版本 3.7.0,深度學(xué)習(xí)框架TensorFlow 2.4.1,輔助庫NumPy 1.19.5、OpenCV 4.5.1、 scikit-learn 0.24.1。
3.3 實驗性能評價指標(biāo)
為了精準(zhǔn)地對“團霧”圖像進行分類,利用CNN技術(shù)提取“團霧”的關(guān)鍵特征,隨后借助SVM進行精確的分類。準(zhǔn)確率、精確率、召回率和F1值都是衡量模型性能的重要標(biāo)準(zhǔn)。根據(jù)具體的應(yīng)用場景和需求,可以選擇適合的指標(biāo)來評估模型的性能,以便更好地優(yōu)化模型并提高其實用性。
4" 實驗結(jié)果及分析
本節(jié)分別對卷積神經(jīng)網(wǎng)絡(luò)(CNN) 模型、支持向量機(SVM) 模型以及兩者結(jié)合的CNN-SVM模型進行性能評估。通過計算準(zhǔn)確率、精確率、召回率和F1值,比較不同模型的表現(xiàn)。
4.1 準(zhǔn)確率(Accuracy)
分別對CNN、SVM和CNN-SVM模型在10次迭代中的準(zhǔn)確率進行計算,結(jié)果如表1所示。從表中可以發(fā)現(xiàn):CNN模型的準(zhǔn)確率逐步提升,最終達到80%;SVM模型的準(zhǔn)確率相對較低,波動在63%至72%之間;CNN-SVM模型在所有迭代中均表現(xiàn)出高準(zhǔn)確率,穩(wěn)定在88%至92%。
CNN模型在經(jīng)過多次迭代后,其準(zhǔn)確率明顯高于SVM模型。而結(jié)合CNN和SVM的CNN-SVM模型不僅繼承了CNN的特征提取能力,還利用了SVM在分類任務(wù)中的優(yōu)勢,顯著提升了整體準(zhǔn)確率,分別較SVM和CNN模型提升了約20%和12%。
4.2 精確率(Precision)
精確率的計算結(jié)果如表2所示。具體表現(xiàn)為:SVM模型的精確率在61%至69%波動;CNN模型的精確率逐步提升,最終穩(wěn)定在70%至72%之間;CNN-SVM模型的精確率高達85%至89%,明顯優(yōu)于其他兩種模型。
CNN模型的精確率優(yōu)于SVM模型,顯示出在正樣本預(yù)測上的更高可靠性。CNN-SVM模型進一步提升了精確率,證明了融合模型在減少假正例方面的有效性,分別較SVM和CNN模型提升了約20%和17%。
4.3 召回率(Recall)
召回率的計算結(jié)果如表3所示。具體表現(xiàn)為:SVM模型的召回率在62%至71%;CNN模型的召回率逐步提升,最高達到78%;CNN-SVM模型的召回率高達74%至83%,顯著優(yōu)于其他兩種模型。
CNN模型在召回率上優(yōu)于SVM模型,表明其在識別正樣本方面表現(xiàn)更佳。融合后的CNN-SVM模型進一步提升了召回率,體現(xiàn)了其在減少漏報方面的優(yōu)勢,分別較SVM和CNN模型提升了約12%和5%。
4.4 F1值(F1 Score)
F1值的計算結(jié)果如表4所示。具體表現(xiàn)為:SVM模型的F1值在67%至80%;CNN模型的F1值在69%至79%;CNN-SVM模型的F1值高達86%至90%,顯著優(yōu)于其他兩種模型。
F1值綜合考慮了精確率和召回率,反映了模型在分類任務(wù)中的整體性能。CNN模型的F1值優(yōu)于SVM模型,而CNN-SVM模型則在F1值上表現(xiàn)最佳,較SVM和CNN模型分別提升了10%和11%。這進一步證明了融合模型在綜合評價指標(biāo)上的優(yōu)勢。
5 總結(jié)
基于CNN-SVM的“團霧”圖像檢測方法在準(zhǔn)確率、精確率、召回率和F1值等多個指標(biāo)上均優(yōu)于單獨使用CNN或SVM模型。這說明融合卷積神經(jīng)網(wǎng)絡(luò)與支持向量機的優(yōu)勢可以有效提升模型的整體性能和分類準(zhǔn)確性。特別是在處理復(fù)雜的圖像分類任務(wù)時,CNN-SVM模型表現(xiàn)出更強的魯棒性和泛化能力。
本研究深入探討了“團霧”檢測方法,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(CNN) 與支持向量機(SVM) 模型,提出了一種創(chuàng)新的CNN-SVM融合模型用于“團霧”圖像的檢測與分類,為“團霧”檢測提供了新的視角和實踐路徑,并有望在未來智能交通和自動駕駛領(lǐng)域發(fā)揮重要作用。
參考文獻:
[1] 金小飛.基于深度學(xué)習(xí)的單幅圖像去霧算法研究[D].南京:南京郵電大學(xué),2023.
[2] 王琦,馮海霞,田俊,等.基于時間序列的團霧監(jiān)測與預(yù)警系統(tǒng)[J].天津理工大學(xué)學(xué)報,2021,37(6):58-64.
[3] 劉建磊,劉曉亮.基于視頻圖像對比度的團霧檢測算法[J].光電子技術(shù),2015,35(2):91-95.
[4] 常榮,陳松,徐德保,等.基于多特征團霧圖像分類算法[J].滁州學(xué)院學(xué)報,2020,22(5):25-29.
[5] 李靜,郝衛(wèi)東,朱劍芳.基于顏色和區(qū)域面積的目標(biāo)識別算法研究[C]//Intelligent Information Technology Application Association.Proceedings of the 2011 International Conference on Future Computer Science and Application (FCSA 2011 V2). 桂林: 桂林電子科技大學(xué),2011:4.
[6] KIM Y H,MOON S H,YOON Y.Detection of precipitation and fog using machine learning on backscatter data from lidar ceilometer[J].Applied Sciences,2020,10(18):6452.
[7] LI L L,YANG B,CHEN S H.Detection of agglomerate fog based on a shallow convolutional neural network[J].Multimedia Tools and Applications,2022,81(2):2841-2857.
[8] 陳雅.基于卷積神經(jīng)網(wǎng)絡(luò)的大數(shù)據(jù)圖像智能識別方法研究[J].信息與電腦(理論版), 2024,36(6):137-139.
[9] 王燕.基于深度卷積神經(jīng)網(wǎng)絡(luò)的垃圾分類算法研究[J].造紙裝備及材料,2024,53(1):104-106.
[10] 史騰飛,尚家秀,吳宗航.基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類改進方法研究[J].現(xiàn)代信息科技,2023,7(5):109-112.
【通聯(lián)編輯:唐一東】