摘要:吸煙行為檢測作為禁煙區域管理中的重要技術,近年來受到了廣泛關注和應用。隨著圖像識別技術的發展,特別是深度學習方法的引入,吸煙行為的檢測精度和實時性得到了顯著提升。該綜述總結了基于圖像識別的吸煙檢測技術的研究進展,重點討論了多種應用方法,包括傳統特征提取(如HOG)、卷積神經網絡(CNN)、時序建模(如LSTM)、Trans?former及新興技術等。通過分析吸煙行為的圖像特征,結合這些模型,可以有效識別吸煙行為并實現精準定位。此外,本綜述總結了當前技術的局限性,并展望了未來的發展方向,旨在為吸煙行為檢測技術的進步提供新思路,推動相關研究與應用。
關鍵詞:吸煙行為檢測;圖像識別技術;深度學習;計算機視覺;技術挑戰
中圖分類號:TP18文獻標識碼:A
文章編號:1009-3044(2025)20-0031-04
0引言
0.1禁煙政策背景
吸煙是全球公共健康領域的重要挑戰之一,與多種慢性病(如心血管疾病、肺癌等)密切相關。各國政府相繼出臺嚴格的禁煙政策,要求在公共場所、工作環境等區域實施有效的吸煙行為管控。傳統管理依賴人工巡查和煙霧探測,存在覆蓋有限、實時性差及誤報率高等問題,難以滿足現代化需求。因此,開發智能吸煙行為檢測技術成為研究重點。
0.2技術進展
近年來,圖像識別技術的快速發展,深度學習在計算機視覺領域的突破為吸煙檢測提供了新方案[1]。通過視頻監控數據分析,可實現實時預警,能夠實現自動化檢測,極大地減少了人工干預的需要[2]。早期方法依賴手工特征提取,如方向梯度直方圖(HOG)和尺度不變特征變換(SIFT)等[3],泛化能力有限,難以應對光照變化和遮擋等干擾。卷積神經網絡(CNN)憑借強大特征學習能力提升了檢測精度[4],時序建模(如LSTM)則增強了動作識別,Transformer模型也在復雜場景中嶄露頭角。然而,實際應用中仍面臨挑戰:1)光照、背景及遮擋影響魯棒性;2)吸煙行為及工具多樣性增加檢測難度;3)實時性受計算資源限制。優化模型性能及適應性成為關鍵方向。
1圖像識別技術
1.1圖像識別技術的基礎
圖像識別技術旨在通過計算機自動分析、理解并分類圖像中的信息。其基本流程通常包括圖像預處理、特征提取和模型訓練三個主要環節[5]。圖像識別技術基本流程如圖1所示。
1)圖像預處理。圖像預處理是提高識別精度和處理效率的關鍵步驟。常見的預處理技術包括圖像去噪、灰度化、歸一化、增強對比度、邊緣檢測等。通過去除噪聲、提高圖像質量,預處理可以有效減少后續特征提取中的干擾,提高算法的穩定性和準確性。
2)特征提取。特征提取是圖像識別中的核心任、信息量大的特征。傳統特征提取方法如HOG(方向梯度直方圖)、SIFT(尺度不變特征變換)和SURF(加速穩健特征)等,主要依賴于圖像中的邊緣、角點、紋理等低級特征,但對復雜場景的泛化能力有限。深度學習興起后,卷積神經網絡(CNN)通過多層結構自動提取高級特征[6],捕捉多尺度信息。此外,LSTM適用于時序數據分析,Transformer則在全局特征建模中表現優異。
3)模型訓練。圖像識別模型的訓練過程通常依賴于大規模標注數據集。訓練過程中,模型通過反向傳播算法逐步優化參數,最小化預測值與真實標簽之間的誤差。訓練完畢后的模型可以用于對新圖像進行分類、檢測和分割等任務。對于吸煙行為等動態識別,須結合視頻序列訓練,常用數據增強和遷移學習提升泛化能力。深度學習顯著提升了圖像識別性能,尤其是CNN、LSTM和Transformer在復雜場景中展現出強大潛力。
1.2吸煙行為的圖像特征
吸煙檢測中圖像特征通常涵蓋吸煙動作、煙霧可視化與煙蒂出現等[7]。識別這些特征對于準確判斷是否為吸煙行為至關重要。
1)吸煙動作特征。吸煙動作(如手持煙支至嘴部)是核心標志,可通過HOG提取邊緣特征,或用CNN捕捉姿態細節。例如,利用卷積神經網絡(CNN)能夠準確識別吸煙者的動作特征。CNN檢測吸煙動作的特征圖如圖2所示,最終檢測吸煙動作如圖3所示。LSTM結合視頻序列可進一步分析動作的時序變化,提高動態識別精度。
2)煙霧特征。煙霧的出現是吸煙行為的重要標志之一。煙霧可以通過攝像頭捕捉到的圖像中的光學特性進行檢測。由于煙霧的運動具有不規則性且在不同環境下呈現不同的視覺效果,因此檢測煙霧是一項具有挑戰性的任務。例如,研究者通常采用基于卷積神經網絡(CNN)的目標檢測方法,結合煙霧的動態變化特性,進行有效的煙霧檢測和追蹤,其中煙霧詳細圖如圖4所示。Transformer則通過全局建模提升復雜背景下的煙霧追蹤能力。
3)煙蒂特征,且常伴隨火焰和煙霧的產生。煙蒂在吸煙過程中通常表現為煙。圖像中的煙蒂特征一般表現為較亮的顏色和溫度變化。例如,可用CNN檢測其視覺特征,傳統方法如SIFT也適用于簡單場景下的定位分析。其中,采用CNN檢測的煙蒂詳細圖如圖5所示。
吸煙行為的圖像特征具有一定的多樣性和復雜性,尤其在實際應用中,攝像頭的視角、背景環境、光照條件等都會影響特征的表現。因此,如何在復雜環境下提取到穩定且具有判別力的吸煙特征,是吸煙行為識別中的關鍵挑戰。
2基于圖像識別的吸煙檢測方法
2.1基于傳統方法的吸煙檢測
傳統計算機視覺技術依賴手工特征提取和分類器實現吸煙檢測。常見的特征提取方法包括方向梯度直方圖(HOG)、尺度不變特征變換(SIFT)和加速穩健特征(SURF)等。
1)HOG(方向梯度直方圖)。HOG是最早用于物體檢測的一種特征提取方法,通過計算圖像區域內的梯度方向并統計直方圖來描述圖像的局部特征。對于吸煙行為檢測,HOG能夠提取人體的輪廓、手臂動作等特征,尤其在背景較為簡單的環境下表現較好。HOG特征的優勢在于其計算效率高,例如在640×480分辨率圖像上,特征提取時間約為30~50ms。但在復雜環境中,背景噪聲和光照變化可能影響其檢測精度。
2)SIFT(尺度不變特征變換,通過檢測關鍵點并計)。SIFT是一種能夠算其局部特征描述子,從而實現圖像匹配和目標識別,具有尺度不變性、旋轉不變性和部分光照不變性。在吸煙檢測中,SIFT常用于識別吸煙者手部和煙支等物體,特別是在不同視角和尺度下具有較好的魯棒性。然而,SIFT算法的計算量較大,例如,在640×480分辨率圖像上,特征提取時間約為100~200ms,實時性有限,在處理實時視頻流時可能存在延遲。
3)SURF(加速穩健特征)。SURF是對SIFT的改進,采用Hessian矩陣來檢測特征點并生成描述子,具有更高的計算效率。SURF在吸煙檢測中的應用,主要用于快速提取煙霧、煙支及人物的局部特征,在一些實時性要求較高的場景中較為適用。例如,在640×480分辨率圖像上,特征提取時間約為50~80ms,但缺點與SIFT類似,在復雜場景下的表現依然受限,特征區分性可能不足。
盡管這些傳統方法在一些簡單的檢測任務中具有一定效果,但由于它們主要依賴手工設計特征,難以應對復雜環境和動態變化,因此在實際吸煙檢測應用中受到局限,難以滿足高準確率和強魯棒性的需求。
2.2基于深度學習的吸煙檢測
深度學習通過端到端學習克服了傳統方法的不足,在吸煙檢測中應用廣泛,涵蓋多種模型架構。
1)卷積神經網絡,由多個卷積層(CNN)。CNN、是深度學習中的池化層和全連接層組成。卷積層提取特征,池化層通過降低特征圖的維度來減少計算量,全連接層則負責最終的分類決策。在吸煙檢測中,CNN能夠通過學習圖像中的復雜特征,如吸煙者的動作和煙霧的動態變化等,進行準確分類。通過多層卷積和池化操作,CNN能夠捕捉到不同尺度和抽象層次的圖像信息,因此在復雜的吸煙行為檢測任務中表現出色。
2)時序建模(LSTM)。吸煙行為具有動態特性,如從持煙到吐煙的連續動作,單幀圖像難以捕捉完整模式。長短時記憶網絡(LSTM)通過記憶單元和門控機制(輸入門、遺忘門、輸出門),有效建模視頻序列中的時序依賴,避免傳統RNN的梯度消失問題。在吸煙檢測中,LSTM常與CNN結合,CNN提取每幀空間特征(如手部動作),LSTM分析幀間變化,識別吸煙動作的動態過程,例如區分“持煙至嘴”與“單純持物”。
①LSTM的優點:具備長期行為跟蹤能力,適用于視頻監控中的持續檢測。
②LSTM的缺點:計算復雜度較高,實時性受限,且長序列可能遺忘早期信息。為提升性能,可結合雙向LSTM或注意力機制優化。
3)Transformer。Transformer通過自注意力機制建模全局特征,超越CNN的局部感受野,適用于復雜背景下的吸煙檢測。VisionTransformer(ViT)將圖像分塊,通過自注意力計算各區域關系,增強對手部、嘴部、煙霧特征的魯棒性。尤其在煙霧檢測中,Trans?former能捕捉不規則動態模式,TimeSformer則進一步分析動作時序。
合大規模數據訓練①Transformer。的優點:表達能力和適應性強,適②Transformer的缺點:計算量大、顯存需求高,未經優化的模型難以實時部署。輕量化變體(如SwinTransformer)可平衡性能與效率。
4)效果與優化。深度學習模型通過準確率、精確率、召回率和F1分數評估性能,高精確率減少誤報,高召回率降低漏檢。遷移學習利用預訓練模型(如ResNet)微調,數據增強(如旋轉、光照調整)提升泛化能力。然而,高計算需求限制實時性,尤其在邊緣設備上。在優化上,輕量化設計(如MobileNet)用深度可分離卷積減少計算量,邊緣部署降低延遲。注意力機制(如SENet)和混合架構(如ConvNeXt)進一步提升效率與精度,平衡性能與資源消耗仍是關鍵方向。
盡管基于深度學習的吸煙檢測方法在精度和魯棒性上表現優異,但也面臨計算資源需求較高、實時性差等問題。為了提高模型的應用性,一些研究提出了優化模型結構和訓練策略,以降低計算開銷。CNN的進階版通過深度殘差學習(如ResNet)、注意力機制(如SENet、CBAM)、輕量化設計(如MobileNet)、Trans?former融合(如ConvNeXt)以及高效目標檢測(如YOLO)等創新,顯著提升了精度、效率和適應性。這些改進使其在復雜場景下表現更優,尤其適用于吸煙行為檢測等任務。
2.3新興技術
新興技術如生成對抗網絡(GAN)、圖神經網絡(測帶來創新GNN)、自監督學習,彌補了傳統和早期深度學習方法的不足(SSL)和強化學習(RL)為吸煙行為檢。
1)生成對抗網絡,增強數據多樣性(GAN)。,GAN彌補標注數據不足通過對抗訓練生。可模擬光照、遮擋下的吸煙場景(如煙霧、手勢),提升模型泛化性,但計算成本較高。實際應用中,包括利用GAN生成多樣化的吸煙圖像數據集,用于訓練模型以適應不同天氣條件下的室外監控場景。
2)圖神經網絡(GNN)。GNN建模吸煙者手部、嘴部、煙支之間的關系,結合關鍵點檢測區分吸煙與相似動作,適合復雜場景。優勢在于關系分析,缺點是對預處理依賴較強。實際應用中,包括在公共場所監控中通過GNN分析手-嘴-煙支的關聯,準確區分吸煙與喝水等相似動作。
3)自監督學習(SSL)。SSL利用無標簽數據預訓,緩解數據瓶頸,提升魯棒性,前期需大量數據支持。實際應用中,包括利用SSL在未標注的視頻數據上預訓練模型,隨后微調用于工廠車間吸煙檢測任務,提升跨場景適應性。
4)強化學習,減少計算冗余(RL)。RL,優化檢測策略增強自適應性,,如聚焦關但須設計有效的獎勵函數。實際應用中,包括在實時視頻流中通過RL指導模型優先分析包含吸煙動作的幀,用于車站候車室的吸煙監控,提高檢測效率。
這些技術拓展了吸煙檢測的邊界,但計算復雜度和實際部署方式仍須進一步優化。
2.4吸煙檢測中常用的數據集
數據集是深度學習模型訓練和評估的基礎,吸煙行為檢測中常用的數據集為模型提供了豐富的標注數據,有助于研究者提高模型的性能。以下是幾個常用的吸煙檢測數據集。
1)SmokerandNonSmokerDataset(Khan,2020)。2400張圖像,二分類標注,多樣性高,適合初學研究。
2)Cigarette-SmokerDetectionDataset(Vitaminc,Kaggle)。專注香煙檢測,YOLO兼容,規模適中,適合實時應用。
3)SelfConstructedSmokingDataset(YOLOv8MNCStudy)。11629張圖像,自建靈活,適用于小目標檢測。
4)YOLOv5Smoking-DetectionDataset。基于Kaggle數據,經過YOLOv5優化,適用于實時部署研究。
5)VidTIMITDataset。VidTIMIT是一個視頻數據集,包含多種人物行為的視頻序列,適用于人體行為識別任務。盡管該數據集的重點不是吸煙行為,但通過使用該數據集進行遷移學習,許多吸煙行為檢測模型在訓練過程中能夠獲得更好的泛化能力。
此外,還有一些基于公共平臺(如Kaggle、UCI等)的吸煙行為檢測數據集,這些數據集通常具有較高的多樣性,能夠幫助研究者評估模型在各種環境下的表現。數據集的選擇對于吸煙行為檢測模型的訓練至關重要。研究者需要根據實際應用場景的需求,選擇合適的數據集,并通過數據增強、標注優化等方式提升模型的訓練效果。
3吸煙檢測的應用與挑戰
3.1吸煙行為檢測的應用場景
吸煙檢測技術廣泛應用于公共場所、企業安全管理、煙草行業及公共安全監控等領域,以提高禁煙管理的執行力并降低安全隱患。在醫院、學校、地鐵站等禁煙區,該技術可實時監測違規行為,觸發警報并通知管理人員,以減少二手煙危害。在易燃易爆環境,如生產車間和倉儲區,吸煙檢測結合智能報警系統,有助于預防火災,提升安全管理水平。此外,煙草企業可利用該技術監控生產流程,分析市場吸煙趨勢,并應用于防偽識別;而城市管理部門可將其集成至公共安全系統,加強智能預警能力。
3.2吸煙檢測中的技術挑戰
盡管吸煙檢測技術在多個領域展現出顯著優勢,但其應用仍面臨諸多挑戰。
1)光照變化、遮擋及背景噪聲降低精度。傳統方法(如HOG、SIFT)對此尤為敏感,解決方案包括通過CNN化檢測效果的自適應特征提取或。
2)吸煙動作差異影響泛化能力,解決方案是通過。不同人群與場LSTM的時序分析及數據增強提升適應性。
3)實時性要求較高的場景,解決方案是采用模型量化與輕:如火災預警與公共安全量級神經網絡(如MobileNet、EfficientNet)優化性能。
3.3吸煙行為檢測的智能聯動與報警系統
為提高檢測效率,吸煙檢測技術常與智能系統集成,實現聯動報警與自動化控制。檢測到吸煙行為后,聲光報警系統可即時觸發警報,提醒違規者并通知管理人員,并與CNN和LSTM的實時檢測能力結合。在高風險區域,智能聯動系統(如電子圍欄與門禁)可自動發出警告或限制人員通行,確保安全管理。云平臺與物聯網(IoT)支持遠程監控和趨勢分析,Transformer的全局特征建模可優化數據處理。
4結論
吸煙行為檢測技術在圖像識別技術的推動下取得了顯著進展,從傳統方法(HOG、SIFT、SURF)到深度學習(CNN、LSTM、Transformer)及新興技術(GAN、GNN、SSL、RL)的演進,極大提升了檢測精度與應用潛力,但仍須優化數據集質量與計算效率。未來研究應聚焦于通過技術融合與創新改進現有模型:一是提升數據集多樣性與標注質量,利用GAN和SSL增強數據生成與泛化能力;二是開發輕量級深度學習模型,結合模型量化技術提高實時性;三是推動跨領域技術融合,如集成多模態傳感器(圖像、紅外、熱成像)以增強復雜環境下的檢測精度[8],同時結合物聯網(IoT)和智能監控系統實現自動識別、預警與干預。總之,隨著數據優化、技術融合與算法改進,吸煙檢測將在公共安全、企業管理和煙草行業中實現更精準高效的應用,助力智能化禁煙管理。
參考文獻:
[1]ZHANGZ,CHENHY,XIAORJ,etal.Researchonsmokingde?tectionbasedondeeplearning[J].JournalofPhysics:ConferenceSeries,2021,2024(1):012042.
[2]WANGZ,LEIL,SHIP.SmokingbehaviordetectionalgorithmbasedonYOLOv8MNC[J].FrontiersinComputationalNeurosci?ence,2023(17):1243779.
[3]李林,吳躍,葉茂.基于概率圖模型的圖像整體場景理解特征工程綜述[J].計算機應用研究,2015,32(12):3542-3550.
[4]周飛燕,金林鵬,董軍.卷積神經網絡研究綜述[J].計算機學報,2017,40(6):1229-1251.
[5]唐璐,趙英.基于深度學習的圖像分割技術研究綜述[J].電腦知識與技術,2023,19(23):30-32.
[6]徐輝,祝玉華,甄彤,等.深度神經網絡圖像語義分割方法綜述[J].計算機科學與探索,2021,15(1):47-59.
[7]何嘉彬,李雷孝,林浩,等.面向計算機視覺的吸煙檢測方法研究綜述[J].計算機工程與應用,2024,60(1):40-56.
[8]LAKATOSR,POLLNERP,HAJDUA,etal.Amultimodaldeeplearningarchitectureforsmokingdetectionwithasmalldataapproach[J].FrontiersinArtificialIntelligence,2024,7:1326050.
【通聯編輯:唐一東】