999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的汽車智能座艙告警篩選系統

2025-08-15 00:00:00張瑩袁海兵何祺姜立標陳毅鋒陳橋芳
重慶大學學報 2025年8期
關鍵詞:告警信號機器文本

doi:10.11835/j.issn.1000-582X.2025.08.009

關鍵詞:機器學習技術;智能座艙告警;告警源;CNN中圖分類號: 文獻標志碼:A 文章編號:1000-582X(2025)08-099-12

Machine learning-based intelligent cabin alert filtering system for vehicles

ZHANG Ying',YUAN Haibing2,HE Qi3 , JIANG Libiao4a5,CHEN Yifeng6, CHEN Qiaofang4b (1. Syncore Autotech Co.,Ltd., Guangzhou 511400,P.R. China; 2. GAC Energy Technology Co.,LTD.,

Guangzhou 510800,P.R.China; 3.GAC Toyota Motor Co.,LTD., Guangzhou 511455,P.R. China; 4a.School of Mechanical Engineering and Robotics; 4b. Institute of Engineering Research, Guangzhou City University of

Technology,Guangzhou 510800,P.R.China; 5.Schoolof Mechanical and Automotive Engineering,South China University of Technology ,Guangzhou 510641,P.R. China; 6. School of Vehicle Engineering, Chongqing University of Technology, Chongqing 400054,P.R. China)

Abstract:This study presents amachine learning-based intelligent cabin alert filtering system for vehicles aiming to address safety risks caused by excessive and redundant alarm sources.To overcome limitations in current systems,such as alarm redundancy and inaccurate classifications,a hybrid selection strategy is proposed that combines manual expert filtering with aconvolutional neural network (CNN)model. The system integrates operational data from various devices,applying manual heuristics to eliminate likely 1 signals and employing the CNN model for robust feature extraction and precise classification.Experimental results show that the CNN model achievesaclassificationaccuracyof 89.07% on the test dataset.When combined with manual filtering, the overall selection accuracy of alarm signals reaches 99.998% ,significantly surpassing the conventional VAS system (90%) ).These results validate the proposed method’s efectiveness in filtering alarm information.Future research will focus on expanding training datasets,optimizing model parameters,and improving text preprocessing techniques to further enhance the overall system performance.

Keywords: machine learning; intelligent cabin alarms; alarm filtering; CNN

汽車是現代社會重要的交通工具,其安全性受到廣泛關注。隨著智能交通系統的發展,汽車座艙集成了眾多電子系統和信息顯示裝置,如車載導航、駕駛輔助系統等。這些系統在提供便利的同時,可能導致信息過載。智能告警系統在座艙人機交互中扮演關鍵角色,負責及時準確地傳遞關鍵安全信息,輔助駕駛員做出正確決策,避免或減輕事故危害。汽車配備多種傳感器監測車輛狀態和周圍環境。例如,輪速傳感器、加速度傳感器、陀螺儀等實時獲取車輛行駛動態信息,如:車速、加速度、轉向角度等[2]。環境感知傳感器如:毫米波雷達、攝像頭、激光雷達監測車輛周圍障礙物、其他車輛及行人的位置與運動狀態3]。車輛總線數據通過車內通信網絡收集來自發動機管理系統、制動系統、電池管理系統(針對電動汽車)等電子控制單元(electronic control unit,ECU)的數據,反映車輛關鍵部件工作狀況,為智能告警系統提供車輛健康狀態依據[4]。

告警系統在汽車座艙生產運行管理中至關重要,及時提醒操作人員和工廠人員異常狀態或設備故障。智能監控告警信息是監控設備運行狀態的關鍵手段[5]。設計一套高效智能預警系統,能提升設備操作安全性和保障車輛安全,實現經濟和社會價值。然而,過多的告警源會導致系統小故障觸發大量告警信號,而大故障可能無法得到及時發現。因此,眾多研究人員開始探索利用數據挖掘技術提升智能預警系統的工作效率與控制能力。早期的方法主要基于專家經驗及特定領域的知識積累,隨著監測數據規模的增長及機器學習方法的進步,現代警報系統逐步融合了人工智能技術,借助對語義信息的智能分析與處理手段,構建一系列高效的故障識別模型,為汽車座艙報警功能的優化與開發提供了有力支持]。

告警呈現方式包括:視覺告警、聽覺告警和觸覺告警。視覺告警傳統上通過儀表盤上的指示燈提示車輛故障、系統狀態等信息。改進后的抬頭顯示系統(head up display,HUD)將重要信息投影在擋風玻璃上,減少視線轉移。聽覺告警包括蜂鳴聲和語音提示,適用于多種駕駛場景[8]。觸覺告警通過座椅震動和方向盤震動提示駕駛員,不占用視覺、聽覺通道,有效吸引駕駛員注意。駕駛員對告警的響應特性包括:視覺注意力分配、聽覺認知負荷和觸覺感知敏感度。視覺告警位置、亮度、顏色和呈現時間影響駕駛員視線轉移速度、準確性及回視道路的及時性。聽覺告警過多或不合理會增加駕駛員認知負荷,干擾正常駕駛信息處理。觸覺告警的敏感度存在個體差異,且在不同駕駛狀態下反應不同[10]。當前告警系統研究存在問題,包括:多源信息融合的精準度與可靠性、告警個性化程度不足和人因工程考慮欠缺。不同傳感器在精度、可靠性、數據更新頻率等方面存在差異,影響危險預測與告警觸發]。現有智能告警系統采用統一告警策略,未充分考慮駕駛員個體差異、駕駛習慣及駕駛任務特殊性。告警系統設計過程中未能全面優化告警與人的交互體驗[2]。

汽車座艙智能報警系統的開發目標是對各類警報信息進行統一管理與有效調度,其功能涵蓋警報數據的整合、分析與分級處理,同時涉及機器學習模型的構建、驗證及性能評估。此外,系統還需要實現故障信息的主動推送、自動報告生成及人機交互界面的合理布局與設計[13]。如圖1所示,本研究的總體流程圍繞系統設計展開,旨在構建一個具備良好適應性、安全性與識別準確性的智能報警機制,實現對潛在風險的提前預警,提高汽車座艙整體的安全水平[14]。

圖1基于機器學習的汽車座艙智能告警信息分類流程

Fig. 1 Machine learning-based intelligent alert information classificationprocessfor vehiclecockpits

智能報警系統中的告警信息整合流程主要涉及對來自計算機監控系統中各類設備運行狀態的數據采集與歸類。這些數據涵蓋穩態、動態及暫態等多種類型的信息,通過統一方式存儲至集中式數據庫,為后續分析和建模提供基礎支持[15]。此類集成機制有助于提升整體系統的可觀測性與可控性,便于工作人員全面掌握設備運行狀況。在汽車座艙應用場景中,告警信號依據其影響程度通常被劃分為5類:異常、事故、越限、變位以及告知。其中,前3類具有較高優先級,,在系統運行過程中實現快速響應。異常信號直接反映了設備當前的運行狀態;事故信號多由硬件故障引發,如開關跳閘等,通過保護裝置觸發告警,提示維護人員及時介人;越限信號則表示某項參數超出預設的安全范圍,屬于需要重點關注的預警信息;變位信號主要體現開關類部件的狀態變化過程,例如斷開或閉合操作,這類信號記錄了系統狀態的動態演變,也應實時采集并納入監控體系[17;告知類信號作為最低級別的告警信息,在設備正常運行時持續反饋狀態,起到輔助監測作用。針對不同類型告警信號的特征差異與優先等級,應采取相應的整合策略以提高信息處理效率[18]。筆者在汽車座艙場景下采用了聯邦數據庫架構來實現告警數據的集成管理,該架構有效支持來自多種異構設備數據源之間的分布式接人與統一調度[。為進一步提升分類模型的識別精度,還需要對整合后的數據執行一系列預處理步驟,包括:噪聲抑制、缺失值填充及數值歸一化等關鍵環節。考慮到智能告警信息具有的高維分布性和來源多樣性特點,本研究采用小波閾值去噪法對原始數據進行降噪處理,具體流程包括:數據矩陣轉換、二維小波分解、系數閾值調整及信號重構等步驟。經過降噪后的數據再利用K近鄰算法完成缺失值的填補,最終通過歸一化操作形成結構化且標準化的數據集,用于后續模型訓練與性能驗證[20]。

汽車智能座艙告警篩選方法包括:1)經驗篩選法,利用專家經驗和規則庫篩選告警,優點是簡單易實現、可解釋性強,但維護成本高、易誤報漏報;2)神經網絡經驗篩選法,通過神經網絡學習歷史數據和反饋構建模型,優點是適應性強,但模型解釋性差,需大量高質量數據;3)文本向量法:將告警文本轉化為向量,用相似度方法篩選,優點是處理文本信息、挖掘語義,但對預處理要求高,難以處理模糊信息。

當下研究不足之處,最主要為現有方法未充分考慮駕駛員個性化需求,缺乏多模態信息融合,且實時性和計算效率有待提升。研究針對以上情況基于機器學習進行個性化實時告警篩選,基于知識圖譜的告警信息解釋,旨在提高篩選準確性和可靠性,增強可解釋性和可信度。

1汽車座艙告警信息概述

汽車作為現代社會最重要的交通工具之一,其安全性一直備受關注。在智能交通系統蓬勃發展的背景下,汽車座艙內集成了越來越多的電子系統和信息顯示裝置,如:車載導航、駕駛輔助系統、車輛狀態監測系統等。這些系統在為駕駛員提供便利的同時,也帶來信息過載的風險。智能告警系統作為座艙人機交互的關鍵環節,肩負著及時、準確地向駕駛員傳遞關鍵安全信息,輔助駕駛員做出正確決策,避免或減輕事故危害的重任[21]。

原理與含義:智能駕駛輔助系統整合了包括自適應巡航控制、車道保持輔助、自動緊急制動等多項功能。這些系統利用雷達、攝像頭等多種傳感器監測車輛周圍的環境以及自身行駛狀態。在檢測到潛在危險或系統功能異常時,系統會發出相應告警[22]。自適應巡航控制告警:自適應巡航控制系統能夠自動調整車速維持與前車的安全距離。若前方雷達傳感器被遮擋(如積雪或污垢覆蓋)或系統故障,無法準確計算與前車的距離,將觸發自適應巡航控制告警。此時,系統可能自動停止工作,并提示駕駛員手動控制車速。車道保持輔助告警:車道保持輔助系統通過攝像頭識別車道線,當車輛偏離車道時,系統會輕微轉動方向盤輔助車輛回歸車道[23]。若攝像頭視野受阻(如雨水、強光干擾)或系統無法正確識別車道線,將發出車道保持輔助告警。這可能導致系統暫時無法正常工作,駕駛員需要更注意車道保持。自動緊急制動系統告警:該系統在檢測到即將與前方障礙物碰撞時會自動執行制動。若傳感器故障,如雷達信號錯誤或軟件算法問題,可能會觸發自動緊急制動系統告警,導致系統誤觸發制動或在必要時無法正常工作,對行車安全構成威脅[24]。

在智能汽車領域,汽車設備會在執行動作或出現故障時自動且實時地發出告警信號。這些信號被收集至汽車內的遠動機,通過調度數據網傳輸至調度部門的智能告警系統。該系統用于集中整合其管理范圍內各類汽車設備所產生的實時告警信號,依據預設邏輯對信息進行過濾、歸類或可視化輸出。由于智能汽車中搭載的設備種類繁多,且每條告警記錄通常包含較為詳細的事件描述,因此,系統整體產生的告警數據規模較大。然而,這些告警信號中的大多數并不代表設備存在缺陷,因此,準確識別缺陷告警信號是關鍵的研究課題。面對龐大的原始告警數據集,傳統的人工經驗篩選方式主要基于對歷史記錄與實際缺陷情況的統計分析,制定相應的信息過濾規則,實現對關鍵設備故障信號的有效識別[2]。該方法通常包括3個核心環節:字段劃分、關鍵詞提取及篩選策略設計。通過對真實數據樣本的深入分析發現,汽車設備常見的異常類型主要包括:未恢復狀態、時間同步偏差以及動作頻率異常3類,分別對應于關鍵字匹配法、時間戳對比法以及頻次統計法3種篩選機制,如圖2所示。

圖2人工經驗篩選算法整體流程

Fig.2Frameworkofartificialexperiencefilteringalgorithm

本研究通過人工經驗篩選策略對告警系統輸出的各類信號進行逐項實時解析,旨在甄別出與設備缺陷存在關聯的潛在告警信息。相較于原始告警數據,經該方法處理后的告警數量顯著降低。通過頻率統計與時間序列對比,進一步確認部分疑似缺陷信號是否真實反映設備異常行為,例如裝置頻繁動作或事件順序(sequence of event,SOE)存在時間偏差等情況。然而,結合實際缺陷統計數據發現,并非所有通過關鍵詞匹配獲得的疑似缺陷告警均為有效缺陷信號,可能包含干擾信息或冗余內容。因此,這些初步篩選結果將作為后續機器學習與自然語言處理技術的輸人數據,用于更深層次的特征提取與分類判斷。該策略可在大幅壓縮待分析告警數量的同時,初步識別部分真實缺陷信號,為基于機器學習的篩選方法提供有效數據基礎。

汽車座艙智能告警系統作為保障行車安全的關鍵技術,在過去幾十年取得顯著進展,從簡單的指示燈告警發展到如今融合視覺、聽覺、觸覺多種模態的智能告警體系。然而,當前研究仍面臨多源信息融合、告警個性化、人因工程優化等諸多挑戰[2]。展望未來,隨著新技術的不斷涌現與應用,智能告警系統有望實現更精準的危險感知、高度個性化的交互以及沉浸式的告警體驗,為駕駛員提供全方位、高效能的安全保障,推動汽車智能化駕駛向更安全、更可靠的方向發展。

2告警信息機器學習篩選模型

2.1 人工篩選經驗法

在對大量原始告警信號應用人工經驗篩選方法后,可以識別部分真實的缺陷告警,并從整體數據中提取少量疑似缺陷信號,顯著降低需要進一步分析的告警數量。根據實際缺陷統計結果可知,盡管通過關鍵詞匹配所獲取的部分告警類型如:保護信號、RTU狀態、通道狀態、通訊狀態、事故總信號、遙控操作等包含設備異常的相關描述,但其中仍存在一定比例的干擾或冗余信息,非全部屬于真實缺陷信號。因此,有必要對這些初步篩選結果進行更深人的甄別處理[27]。研究所提出的機器學習篩選方法正是針對上述6類疑似缺陷告警進行精細化分類的關鍵步驟。為提升對不確定信號的識別準確性,引人基于機器學習的二次篩選機制。接下來將介紹自然語言處理中涉及的機器學習相關理論,并詳細闡述文本分類任務中的主要處理流程,包括:文本預處理、向量化表示、分類模型訓練與測試等內容,同時構建適用于告警信號篩選的機器學習分析框架。由于該方法不依賴于時間戳、信號類型或所屬場站等結構化字段,僅依據缺陷描述文本內容進行判斷。因此,在對信號進行處理時,著重分析其“內容字段\"所承載的語義特征。在篩選實施過程中,“漏選信號\"指的是本應被判定為存在缺陷的信號卻被錯誤歸類為正常樣本的情況,此類信號在全部缺陷樣本中所占比例稱為漏選率;而“誤選信號\"則表示將原本無缺陷的樣本誤判為缺陷信號的現象,誤選率反映這類錯誤判斷在所有正常樣本中所占的比例。

在利用機器學習技術處理自然語言信息時,須按照標準流程進行相應操作。由于機器學習模型僅能處理數值型輸入,在將文本信息輸入模型前,必須經過一系列預處理步驟,將其轉化為可識別的數值形式。研究主要包括5個關鍵環節:訓練集與測試集構建、文本清洗與標準化、特征向量化、模型分類訓練及性能評估,具體研究流程如圖3所示。

圖3機器學習篩選算法整體流程

Fig.3Frameworkofdeeplearningfilteringalgorithm

各部分內容的實現方式如下:

1)訓練集與測試集構建:告警數據涵蓋了6種可能存在設備缺陷特征的信號類型,分為訓練集和測試集。使用有監督的機器學習模型,通過訓練集數據訓練模型學習非線性映射,用測試集數據評估模型準確率。模型輸人為原始告警信號,輸出為二分類結果標簽,缺陷信號標記為“1”,非缺陷信號標記為“0”。

2)文本預處理:處理原始數據以適應文本向量化,包括:統一格式、過濾字符、分詞和對齊。統一格式涉及將告警信號編碼為字符串;過濾字符去除無效字符;分詞將句子拆分為詞語;對齊確保文本詞數一致,不足的用空白詞填充。

3)文本向量化:在自然語言處理中,為使機器學習模型能有效識別和分類文本信息,將經過預處理的詞語轉化為數值型向量形式,完成特征提取與表示轉換。該過程的核心目標是將詞匯映射為具有語義表達能力的低維實數向量,提升模型對文本信息的處理效果。為便于后續計算與建模,每個詞語均被表示為相同維度的數字向量,整段文本則以二維矩陣的形式輸入模型中分析。

4)機器學習分類器:本研究采用卷積神經網絡模型對文本信息進行特征提取與分類分析,實現告警信號的自動識別與篩選。盡管卷積神經網絡常用于圖像處理,但在自然語言處理任務中表現出較強的局部特征捕捉能力。該模型主要包括:輸入層、卷積層和輸出層,其中卷積層負責自動提取文本的關鍵語義特征,通過全連接層結合Softmax函數完成最終分類決策。作為一種監督學習方法,該模型先使用訓練集進行參數學習,再利用測試集評估其分類性能。模型輸出結果為二值標簽,0表示當前信號不屬于真實缺陷,1則表示判定為有效缺陷告警。

5)性能評價:基于模型訓練過程中的輸出結果以及分類器在測試集上的表現,對所構建的機器學習告警信號分類系統進行綜合性能評估與優化調整。設定包括:準確率、誤選率及多選率等關鍵指標,驗證系統在實際應用中的可行性與有效性。

2.2神經網絡篩選經驗法

卷積神經網絡(convolutional neural network,CNN)是一種模仿生物神經系統運作機制的計算模型,通過構建多層次的人工神經元模擬復雜的非線性映射關系。該模型由一系列相互連接的節點組成,這些節點通過彼此間的交互作用處理并轉換輸入數據。CNN被視為一種擁有高度抽象能力的系統,在眾多輸入、輸出實例中自主學習2者間潛在的相關性。通過對大規模數據集進行反復訓練,CNN依據預測誤差調整內部參數,提高識別精度,逼近復雜非線性映射。典型的CNN架構通常包括3個主要層次:輸人層、隱藏層和輸出層。在前饋網絡結構中,信息從輸入層開始,經過一個或多個隱藏層處理后傳遞到輸出層,整個流程為單向流動,沒有反饋回路。不同層級之間通過加權連接實現全連接機制,即上一層中的每一個神經元均與下一層中的所有神經元相連,同一層內的神經元之間則無直接連接。該結構保證了模型對輸入特征的全面捕捉能力,其整體工作機制如圖4所示。

圖4神經元網絡示意圖Fig.4Neural network

2.3 文本向量法

由于告警信息通常由漢字、英文字母及數字混合構成,無法被機器學習模型直接處理,在建模前需要對原始文本進行數字化轉換。為使分類器能夠有效解析告警內容,應選擇合適的向量化策略,將分詞后的詞語映射為對應的數值表示,并將每條告警視為若干詞語的組合,構造成二維矩陣形式,作為卷積神經網絡分類器的輸入結構。

在自然語言處理領域,常見的文本向量化方法主要包括2類:一類是基于統計頻率的詞袋模型(bag ofwords,BoW);另一類是基于語義分布的分布式表示方法(distribution representation,DR)。其中,詞袋模型是一種較基礎且高效的文本編碼方式。該方法通過對語料庫中出現的所有詞匯進行頻率統計,按出現頻次排序后分配唯一編號。通常高頻詞獲得較小的索引值,低頻詞對應較大的數值,實現對詞語的數字化表示。其優勢在于實現簡單、計算開銷小,但存在缺乏語義表達能力和維度災難等問題,難以適應復雜語義任務的需求。考慮到本研究中的告警數據具有表述規范、重復性強、語義信息不突出等特點,且大部分文本來源于設備自動生成,對深層語義理解的要求較低,為提高模型運行效率,研究選用詞袋模型中的詞編碼函數(word encoding function,WEF)進行文本向量化處理。該函數依據詞語在整個語料庫中的出現頻率依次賦予編碼,具備實現簡便、資源占用少等優點,可有效控制特征維度,避免高維稀疏問題。

相比之下,詞的分布式表示方法是一種更先進的向量化技術,也被稱為詞嵌人(word embedding)方法。

它通過數學建模的方式將詞語映射為低維稠密的實數向量,較好捕捉詞語之間的語義關聯性。對于需要深層次語義理解的任務,如情感分析或句法結構識別,此類方法展現出更優的性能表現。主要優勢包括:

1)詞間相似性體現:詞向量之間可通過歐氏距離衡量相似程度,語義相近的詞語其向量距離更小;

2)語義信息豐富:詞向量能夠捕捉詞語之間的深層語義關系,每一維度代表特定的語言特征;

3)維度可控:相比傳統方法,詞向量維度較低,有助于緩解高維帶來的計算負擔。

當前主流的詞向量構建方法主要包括2類:基于統計特征的方法和基于神經語言模型的方法,具體介紹如下:

1)基于統計特征的方法:此類技術通常通過構建詞語共現矩陣,結合奇異值分解等數學手段生成對應的詞向量。盡管該類方法能夠在一定程度上刻畫詞語之間的相關關系,但由于其生成的向量普遍存在稀疏性高、維度龐大等問題,在實際應用中已較少被采用。

2)基于神經語言模型的方法:該方式依賴于神經語言模型(neural network language model,NNLM)的訓練過程,最終輸出即為所需要的詞向量表示。基本原理是借助上下文信息來預測目標詞,獲得具有較強語義表達能力的嵌入向量。這類方法在自然語言處理任務中表現出更優的泛化能力和適應性。

3座艙告警信號實驗方案

3.1 實驗流程

前文已介紹了基于機器學習技術對智能座艙告警信息進行篩選分析的整體流程及關鍵技術原理,包括人工經驗篩選方法與機器學習篩選方法的協同應用機制[28]。本章節旨在通過實際告警數據的篩選實驗,驗證所提方法的有效性與實用性。首先,對采集到的大規模原始告警信息進行系統整理,搭建相應的實驗平臺。隨后,依次采用人工經驗篩選與機器學習模型進行多階段聯合過濾,獲取實驗結果,并對相關算法與模型的性能表現進行評估,驗證該方法在實際場景中的可行性,為后續研究結論的形成提供數據支撐。

實驗所用數據來源于某地市交通局安全3區車輛報警系統(vehicle alerting system,VAS)鏡像服務器的歷史數據庫,完整記錄了1年內積累的所有車輛告警信息。同時,各區授權4S店提供的年度設備缺陷統計表作為分類結果的輔助依據。據統計,全年共采集告警信號約 5571×104 條,主要類型包括:保護信號、測量越限以及事件順序記錄(SOE)等。運維人員記錄的缺陷約550條,主要也是保護信號類。初步篩選采用人工經驗和關鍵字方法,選出疑似缺陷信號。這些信號再經過機器學習方法篩選,得到關鍵指標如準確率、漏選率等,并得出結論。由于缺陷多與保護信號相關,機器學習方法成為篩選重點,綜合性能指標基于整體篩選結果得出,具體篩選步驟如圖5所示。

原始告警信號按照時間順序逐一接收,首先通過人工經驗篩選方法進行初步處理,將篩選結果作為輸人數據送入機器學習篩選模型中進行深人分析。人工經驗篩選環節部署在一臺小型服務器上,使用MicrosoftSQL Server數據庫執行數據校驗與管理任務。實驗中收集的所有原始告警信息被整合導人數據庫,根據VAS系統記錄的時間截排序后,逐條輸入到篩選算法中處理。該階段的人工經驗篩選算法采用SQL語言編寫,因其簡潔語法和高效執行特性,特別適合于大規模數據集的快速處理。機器學習篩選部分則運行在標準個人電腦上,僅利用CPU完成模型訓練與推理計算。篩選算法由MATLABR2018b實現,涵蓋從告警數據輸人、模型訓練到篩選輸出的全過程,生成可視化圖表以輔助結果分析。為了驗證此方法的有效性,研究對所有歷史告警數據進行集中測試。在實際應用場景中,基于預先訓練好的機器學習模型對新產生的告警信號實施實時接收與在線分析,提高系統的響應速度及缺陷識別能力[29]。

3.2 實驗過程

對全部原始告警信號實施預處理操作,包括將文本內容統一轉換為標準字符串格式,采用文檔詞語標記工具對其中的中文部分進行分詞處理。該工具具備識別常見漢語詞匯的能力,實現較為準確的詞語切分效果。在完成分詞后,進一步將所有英文字符中的大寫形式統一轉換為小寫,并清除文本中包含的各類標點符號。通過上述一系列預處理步驟,有效統一輸人數據的格式規范,降低無關信息對后續分析造成的干擾,同時為接下來的文本向量化表示打下良好基礎。使用文檔詞語標記函數前,先構建包含常用詞匯的漢語詞典作為參考依據。在此基礎上,對告警信息中的中文語句進行詞語切分與標注,同時具備識別復雜結構的能力,如網址、表情符號及哈希標簽等內容。通過繪制詞語云圖可觀察到,該方法在常見詞匯識別方面表現良好。在完成分詞后,還要進行文本長度標準化處理。為此,首先統計每條告警信號中所含詞語的數量,如圖6所示,大部分告警信息的詞數較少,最長文本共包含18個詞語。為了在保留完整信息的同時避免輸人維度過高,設定統一輸入長度為18,即以最長告警的詞數為基準。對于詞數不足的樣本,在其文本左側補充占位詞,實現輸入數據的尺寸對齊,使所有樣本在輸入機器學習模型時保持一致格式。在完成前述預處理流程后,緊接著構建基于卷積神經網絡(CNN)的分類型,并以處理后的告警信號數據及其對應類別標簽作為輸入,進行訓練與驗證過程。在模型輸入前的關鍵準備階段,對文本信息進行向量化表示,使其能夠被神經網絡有效識別和處理。

圖6告警信號詞長統計

Fig.6 Alarmsignal word length statistics

考慮到本文所處理的告警信息來源于車載系統,其文本內容通常具有結構清晰、用詞規范、語義直觀等特點,屬于表達形式較為簡潔的短文本類型,一般不涉及復雜的語義理解。為兼顧計算效率與模型實用性,降低整體復雜度,研究采用詞袋模型中的詞編碼函數對文本進行數值化轉換。該方法可將每個詞語映射為一個固定長度的實數向量,確保輸入格式的一致性,同時滿足模型高效運算的需求。

3.3 結果分析

通過多輪實驗對比,最終確定了最優的卷積神經網絡(CNN)模型參數,如表1所示。研究所使用的數據集涵蓋了全年采集的缺陷告警信息,樣本規模較大,具有較強的代表性與統計可信度。首先,采用人工經驗篩選方法對原始告警信號進行初步過濾,有效減少疑似缺陷信號的數量,使疑似缺陷信號的比例由原來的72.41% 下降至 53.31% ;隨后,利用訓練完成的CNN模型對剩余告警信息進行精細化二次篩選,實現較高的分類精度。實驗結果表明,所構建的CNN模型具備良好的學習能力,預測性能優于傳統方法。圖7展示了3種不同算法的測試準確率表現,其中,卷積神經網絡的分類準確率達到 89.07% ,顯示出較好的識別能力。結合人工經驗篩選與神經網絡的綜合方法,其整體告警信號的篩選準確率達到了 99.998% ,顯著高于VAS系統所具備的 90% 準確率,驗證了本方法在告警信息處理方面的有效性與優越性,適用于實際交通設備監測場景。圖8展示了各算法在訓練過程中的損失變化趨勢,總體來看3類算法的訓練損失均維持在較低水平,表明模型收斂狀態良好。

表1CNN機器學習參數

Table1 CNNmachine learningparameters

圖7預測準確度 Fig.7Prediction accuracy

圖8訓練損失 Fig.8Training loss

從算法壓縮效率角度分析,如圖9所示,各模型的壓縮比均控制在0.3以內,表明其資源消耗較低,具備良好的計算輕量化特性,適合實際部署與運行。此外,研究使用機器學習篩選方法對測試集樣本進行了分類統計分析,其置信度分布情況詳見圖10。其中屬于0.6類別的樣本中,識別出缺陷告警104項(時間維度),多維屬性告警152項。在置信度為0.7的類別中,共有78條時間維度告警和124條多維屬性告警。在置信度為0.8的類別中,有58條時間維度告警和83條多維屬性告警。在置信度為0.9的類別中,有36條時間維度告警和61條多維屬性告警。而在置信度為1的類別中,僅有9條時間維度告警和44條多維屬性告警。隨著置信度的提高,數據量逐漸減少。這表明在高置信度下,模型對數據的篩選更加嚴格,只有少數數據能夠達到較高的置信度。

對分類結果中出現誤判的情況進行分析,主要存在以下幾個方面的原因:

1)部分用于訓練與驗證的缺陷信息來源于汽車記錄系統而非VAS告警系統,2類系統的描述方式存在一定差異。例如:紅綠燈同亮消缺、名稱與后臺不對應、后臺機、擋位顯示不正確等術語在原始告警信號中無法找到明確對應的表達,導致樣本標簽與實際輸入信息不匹配,影響數據質量,降低模型的學習效果;

圖9壓縮率 Fig.9 Compressionratio

圖10置信度 Fig.10 Confidence level

2)在實際運維過程中,存在大量未被記錄或遺漏的真實缺陷情況,使訓練樣本中缺陷樣本(正類)比例偏低,分類器難以準確學習關鍵特征,造成模型泛化能力受限;

3)部分告警信號本身語義相近,表述高度相似但類別歸屬不同,如某些保護信號之間僅存在細微差異,卻歸入不同類別,這對模型的區分能力提出較高要求;

4)全年真實缺陷數量相對較少,導致可用于訓練的正樣本規模偏小,整體數據集中有效樣本不足,影響機器學習模型訓練的充分性與穩定性。

研究所提出的基于機器學習技術的智能座艙告警信息分析方法在后續仍有進一步改進空間,主要可從以下幾個方向展開研究:1)擴大卷積神經網絡(CNN)訓練樣本的數量,以提升模型整體識別精度;2)提高原始告警數據的質量與準確性,確保其與實際缺陷信息保持一致;3)深人探索CNN網絡結構中的最優參數組合,增強模型泛化能力避免過擬合現象;4)嘗試引入其他類型的機器學習分類器,如改進型CNN模型,用于提升告警信號分類效果;5)優化文本預處理流程,采用更高效的分詞策略及詞向量生成方式,提升特征表達能力;6)持續完善人工經驗篩選機制,提升輸入數據質量并有效過濾冗余告警。

研究所采用的詞編碼函數算法依據文本中所有唯一詞語的出現頻率進行數值映射。具體而言,在完成詞語頻率統計后,按照頻率由高到低進行排序,并為每個詞語分配相應的編碼值。高頻詞匯賦予較小數值,低頻詞匯對應較大數值,實現對所有詞語的唯一編號轉換,最終構建對應的數字向量形式,完成文本向量化操作。

在實施該算法時,首先對所有文本語料中的詞語進行提取和統計,共識別出1086個不重復詞語。隨后,根據各詞頻分布情況進行降序排列,依次賦予編碼 1~1 086 。對于長度對齊過程中使用的填充詞,則統一賦值為0,完成全部告警信息的向量化表示。完成上述文本預處理之后,進人卷積神經網絡分類器的訓練與測試階段。通過使用訓練集數據多次迭代訓練獲得最優模型參數,再利用測試集對模型性能進行評估,最終得出分類準確率指標,作為模型有效性的重要參考依據。此外,在系統部署與運行成本方面,本文結合系統熵理論計算了各模塊的單位算力成本,結果詳見表2。單位成本反映了獲取單位計算資源所需要付出的成本代價。從計算結果來看,告警篩選系統的單位成本低于常規系統水平,尤其CNN方法的單位成本顯著低于傳統特征分類方法,表明其具備更高的性價比優勢。因此,在實際應用中優先采用CNN模型輸出結果,可在控制成本的同時實現良好的分析效果。

表2單位成本Table2 Unit cost

4結論

在智能汽車座艙系統中,對危險告警的識別主要依賴于座艙告警系統所提供的信息。然而,在實際運行過程中,系統產生的告警信號種類繁多,其中包含大量與設備缺陷無關的冗余信號,這為工作人員準確識別關鍵告警帶來較大困難。針對上述問題,研究提出一種融合人工經驗篩選與機器學習方法的告警信息分析策略。該方法通過雙重篩選機制,實現對原始告警信號的有效分類,能夠精準識別出與設備故障相關的異常信號。主要研究內容與結論如下:

1)單位成本是指獲取單位計算資源所投入的算力代價。根據系統熵方法計算得出的結果顯示,本研究構建的告警篩選系統的單位成本顯著低于傳統系統水平。尤其在模型輸出階段,卷積神經網絡(CNN)所對應的單位成本明顯優于傳統特征分類方法。因此,在實際部署中優先采用CNN模型的輸出結果,有助于在控制成本的同時實現良好的識別效果。

2)在第1階段篩選中,采用人工經驗法成功識別并過濾掉部分非缺陷告警信號,使疑似缺陷信號的比例由原來的 72.41% 下降至 53.31% 。隨后,在第2階段引入基于CNN的機器學習篩選方法進行精細化分類。經過訓練與測試,模型在測試集上的分類準確率達到 89.07% ,表現出較強的判別能力。綜合2種篩選方式的結果,最終對全部原始告警信號的整體篩選準確率高達 99.998% ,遠高于現有VAS系統約 90% 的準確率。實驗結果充分驗證了該方法在實際應用中的有效性與優越性。

3)模型壓縮比均控制在0.3以內,表明計算資源占用率低,具備工程化部署的可行性。通過置信度分級篩選機制,樣本數量隨置信度閾值的提升呈現顯著衰減趨勢,表明模型在高置信度區間對輸入數據的判別標準更為嚴格,有效過濾了低可信度樣本。從工業應用角度而言,為告警信號處理提供了高效、實用的解決方案。

參考文獻

[1]IdlahcenF,IdriA,GoceriE.Exploringdataminingandmachinelearingingynecologiconcology[J].ArtificialInteligence Review,2024,57(2):7-12.

[2]LeonardB.Wellprepared: Howtrichome polymorphismcreates anearly-warning systemagainst herbivory[J].ThePlantCell, 2024,4(12): 6-8.

[3]秦雅琴,夏玉蘭,錢正富,等.微觀軌跡信息驅動的Bi-LSTM合流區車速預測[J].重慶大學學報,2023,46(4):120-128. QinYQ,XiaYL,Qian ZF,etal.Vehicle speed prediction in Bi-LSTMconfluence areadriven bymicro-trajectory information[J]. Journal of Chongqing University,2023,46(4): 120-128. (in chinese)

[4]余煒,曾孝平.麻醉術中絕對血容量不足臨床監測告警系統的設計[J].重慶大學學報,2011,21(8):43-47. Yu W,Zeng X P.Design of clinical monitoring alarm system for absoluteblood volume deficiency during anesthesia[J]. JournalofChongqing University,2011,21(8): 43-47.(inchinese)

[5]高彥,傅春耘,楊忠,等.基于改進粒子濾波算法的車速估計[J].重慶大學學報,2024,47(3):44-52. Gao Y,Fu CY,Yang Z,etal.Vehiclespeed estimationbasedonimproved particle filter algorithm[J]. Jouralof Chongqing University,2024,47(3): 44-52.(in chinese)

[6]馮新揚,張巧榮,李慶勇.基于改進型深度網絡數據融合的滾動軸承故障識別[J].重慶大學學報,2019,42(2):52-62. Feng XY,ZhangQR,LiQY.Rolling bearing faultidentificationbasedonimproveddeep networkdatafusion[J].Jouralof Chongqing University,2019,42(2):52-62.(in chinese)

[7]王博文,王景升,王統一,等.基于長短時記憶網絡的Encoder-Decoder多步交通流預測模型[J].重慶大學學報,2021, 44(11):71-80. Wang B,WangJS,WangTY,etal.Multi-steptrafficflowpredictionmodelbasedonencoder-decoder withlongshort-term memory networks[J]. Journal of Chongqing University,2021,44(11): 71-80.(in chinese)

[8]Wang J,Wang Z,ChenM,etal.Aninterpretableartificialintellgencesystemfordetectingriskfactorsofgastroesophgeal variceal bleeding[J]. Npj Digital Medicine,2022,5(1):114-121.

[9]Wang Y,Jiménez C,Quiroz M,etal.TsunamiearlywaringsystemusingofshoretsunametersinPeru[J].Oean Egeing,

[10]Najafi H,ShresthaPK,RakovecO,etal.Hig-resolutionimpact-basedearlywaringsystemforriverineflooding[J].Nature Communications,2024,15(1): 4-6.

[11]EltounyKA,Liang X.Uncertainty-aware structuraldamage warning system using dep variationalcomposite neuralnetworks [J].Earthquake engineering amp; structural dynamics,2023,3(11): 9-13.

[12]Braun EJ,Singh S,PenleskyA C,etal.Nursing implications of anearly warning system implemented to reduceadverse events: a qualitative study[J].BMJ quality amp; safety,2022,31(10): 716-724.

[13]Subisi LVonGotbergA,TukralL,etal.Anearly warningsystemforemerging SARS-CoV-2variants[J].Nature Medicine, 2022, 7(4): 9-11.

[14]Alonso A.Leak recognition system provides early warning of leaks[J]. Welding Journal,2023,6(3): 10-13.

[15]MurrayJ,CrowellB,MurryM,etalIncorporationof real-timeearthquakemagnitudesestimatedviapeakground displacementscaling in the shake alert earthquake earlywarning system[J]. Buletinofthe Seismological SocietyofAmerica, 2023, 7(4): 8-11.

[16]SieversBL,SiegersJY,CadenesJM,etal.Smartmarkets:harnesingthepotentialofnewtechnologiesforendemicand emerging infectious disease surveillance in traditional food markets[J]. Journal of Virology,2024,98(2): 5-9.

[17]YangLWang Z,Zhang S,etal.Neuromorphic gustatorysystem withsalt-taste perception,information processingand excessive-intake warning capabilities[J]. Nano letters,2022,4(3): 4-7.

[18]Roberts RD,GoodmanSJ,WilsonJW,etal.Takingthe Highwaytosave livesonlake victoria[J]. Bulltinof theAmerican Meteorological Society,2022,7(2):103-106.

[19]TilmanAR,KruegerEHMmanusLC,etal.Maintainnghumanwellbingassocialnvironmentalsystesundergogie shifts[J].Ecological Economics,2024,4(1),221:7-10.

[20]SantiagoID,PlomaritisTA,AvalosD,etal.Comparisonof wave overtoping estimationmodels forurbanbeaches.Towards an early warning system on the Basque coast[J].Science of the Total Environment,2024,3(2):10-12.

[21]Boza JM,AmiraliA,WiliamsSL,etal.Evaluationofafielddeployable,high-throughputRT-LAMPdeviceasaearly warningsystem forCOVID-19 throughSARS-CoV-2 measurements in wastewater[J].Scienceof theTotalEnvironment,2024, 944: 1-11.

[22]FranciscoAPSilviaGM,OteroMJ,etal.Explainablecognitivedeclinedetectioninfreedialogues withaMachineLaing approach based on pre-trained Large Language Models[J].Applied Intelligence,2024,54(24):12613-12628.

[23]HeY,Geng Y,LiMZ.Amachine learningappoachandnumericalivestigationforintellgentforecastingofentropy generationrate insideaturbulator-insertedsolarcolectortube[J].Engineringanalysis withboundaryelements,2024,58: 375-384.

[24]Song Z,Cao S,Yang H.Aninterpretable framework formodeling global solarradiation using tree-based ensemble machine learning and Shapley additive explanations methods[J]. Applied Energy,2024,364(2): 9-12.

[25]Guo Z,Deng J,Tang ZY.Ahybrid methodofcombinationprobabilityand machine learning for Chinese geological text segmentation[J].Computersamp; geosciences,2024,183(1):1-11.

[26]AnconaRM,CooperBP,RandiF,etal.MachinelearningclasificationofnewfirearminjuryencountersintheStLouis region: 2010-202o[J].Journal of the American Medical Informatics Association,2024(10): 9-11.

[27]LiZ,Han M,VoDN,etal.Machine learning-based input-augmented Koopman modeling and predictivecontrolofnonlinear processes[J].Computers and Chemical Engineering,2024,191(13): 7-8.

[28]YagoD,Sal-AngladaG,RocaD,etal.Machine learning insolid mechanics:aplicationtoacoustic metamaterialdesign[J]. International Journal for Numerical Methods in Engineering,2024,125(14):7-10.

[29]LiS,ZhangC,WangX,etal.Amachinelearning methodologyforivestigatingtheliquid-liquidtransitionofhydrogenunder high-pressure[J].International Journal ofModern Physics C,2024,35(12):4-6.

(編輯 侯湘)

猜你喜歡
告警信號機器文本
馬雄冠:于民族危亡之際內遷工廠
基于CT影像組學特征的機器學習模型對癥狀性頸動脈斑塊的診斷價值
基于機器學習的汽車智能座艙告警篩選系統
達·芬奇的10個發明
視野(2025年14期)2025-08-14 00:00:00
論新質生產力對唯物史觀研究范式的革新
在808DA上文本顯示的改善
基于doc2vec和TF-IDF的相似文本識別
電子制作(2018年18期)2018-11-14 01:48:06
文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
如何快速走進文本
語文知識(2014年1期)2014-02-28 21:59:13
主站蜘蛛池模板: 日韩无码一二三区| 亚洲区欧美区| 久久婷婷人人澡人人爱91| 国产av一码二码三码无码 | 国产成人精品视频一区视频二区| 无码专区国产精品一区| 亚洲水蜜桃久久综合网站| 国产精品福利导航| 无码精品国产dvd在线观看9久 | 毛片大全免费观看| 亚洲成人免费在线| 免费国产一级 片内射老| 综合社区亚洲熟妇p| 一级毛片免费观看久| 亚洲免费人成影院| a毛片基地免费大全| 欧美国产精品不卡在线观看| 国产第四页| 亚洲成人网在线播放| 怡红院美国分院一区二区| 久久婷婷色综合老司机| 国产97公开成人免费视频| 欧美日韩午夜| a在线观看免费| 欧美国产成人在线| 老司国产精品视频| 婷婷成人综合| 中文纯内无码H| 欧美成人A视频| 啊嗯不日本网站| 精品久久香蕉国产线看观看gif| 亚洲中久无码永久在线观看软件 | 欧美性猛交一区二区三区| 欧美成人二区| 亚洲精选无码久久久| 久草视频精品| 黄色网站在线观看无码| 日本人妻一区二区三区不卡影院 | 久久国产高潮流白浆免费观看| 91在线播放国产| 亚洲区视频在线观看| 又黄又湿又爽的视频| 99热这里只有精品5| 国产欧美日韩综合在线第一| 国产日韩欧美一区二区三区在线 | 91福利片| 激情综合网址| 精品久久香蕉国产线看观看gif| 国产亚洲欧美日韩在线一区二区三区| 亚洲国产成人久久精品软件| 91久久青青草原精品国产| 午夜国产小视频| 精品久久蜜桃| 青青草原国产精品啪啪视频| 亚洲天堂免费| 老司机久久精品视频| 在线国产毛片手机小视频| 国产一区二区三区日韩精品| 国产系列在线| 日本手机在线视频| yjizz视频最新网站在线| 波多野结衣一区二区三区四区 | 亚洲第七页| 欧美亚洲欧美| 亚洲人成网站18禁动漫无码| 国产三级毛片| 欧美黑人欧美精品刺激| 国产尤物视频网址导航| 欧美人在线一区二区三区| 制服丝袜国产精品| 国产白丝av| 另类专区亚洲| 亚洲久悠悠色悠在线播放| 亚洲精品在线91| 日韩黄色在线| jizz国产视频| 国产精品网址在线观看你懂的| 在线播放国产一区| 青青草原国产免费av观看| 美女毛片在线| 一本一本大道香蕉久在线播放| 欧美福利在线|