卓麗 張亮 程登 黎飛 謝燕芳



【摘? 要】當前,車聯網大數據驅使著智能汽車的發展,基于車聯網大數據分析用戶駕駛行為已成為必然趨勢,但直接分析底層數據是非常困難的,需結合用戶駕駛過程來分析。基于此目的,本課題提出一種基于車聯網大數據的純電動汽車行程識別算法,來實現對整車數據的聚合。
【關鍵詞】車聯網;汽車;大數據;行程識別
中圖分類號:U469.72? ? 文獻標志碼:A? ? 文章編號:1003-8639( 2023 )08-0005-03
Trip Recognition Algorithm of Pure Electric Vehicle Based on Big Data of Internet of Vehicles
ZHUO Li,ZHANG Liang,CHENG Deng,LI Fei,XIE Yan-fang
(SAIC GM Wuling Automobile Co.,Ltd.,Guangxi Laboratory of New Energy Automobile,
Guangxi Key Laboratory of Automobile Four New Features,Liuzhou 545007,China)
【Abstract】At present,the big data of the Internet of vehicles drives the development of intelligent vehicles. It has become an inevitable trend to analyze users' driving behavior based on the big data of the Internet of vehicles. However,it is very difficult to directly analyze the underlying data,which needs to be analyzed in combination with the user's driving process. For this purpose,this topic proposes a pure electric vehicle travel recognition algorithm based on the big data of the Internet of vehicles to realize the aggregation of vehicle data.
【Key words】vehicle networking;automobile;big data;travel identification
1? 緒論
汽車行業已經從機械1.0時代和電子2.0時代,步入智能3.0時代,在未來智能車載系統及自動駕駛技術必將引發一場革命,以汽車制造技術為代表的工業技術和以互聯網技術為代表的信息技術勢必將緊密融合,從而推動汽車行業技術創新。當前,車聯網大數據驅使著智能汽車的發展。所謂車聯網,是以車內網、車際網和車載移動互聯網為基礎,按照約定的通信協議和數據交互標準,實現車與車、人、路、服務平臺之間的網絡連接。車輛的運行往往涉及多項開關量、傳感器模擬量、CAN信號數據等,駕駛員在操作車輛運行過程中,產生的車輛數據不斷回發到后臺數據庫,由云計算平臺實現對數據的“過濾清洗”,數據分析平臺對數據進行報表式處理,供管理人員查看。
2? 研究背景及意義
2.1? 研究背景
經過報表式處理的車輛數據,雖然記錄了車輛在行駛過程中產生的數據,但是直接分析該數據是十分困難且效率低下的。以某熱門純電動汽車為例,每臺車每天產生的數據可達十億數量級,直接對底層數據分析用戶特征值顯然是不現實的。而在數據分析的角度,一個車輛行程表征一個用戶特征,用戶的駕駛線路、駕駛行為以及出行習慣等數據標簽都是基于一個行程來計算的。在此背景下,本課題針對CAN信號數據,提出一種基于車聯網大數據的純電動汽車行程識別算法,以滿足海量的數據分析需求。
2.2? 研究意義
該算法主要解決以下幾個技術問題。
1)精準判斷行程過程:當車輛處于行駛狀態時,通過車聯網獲取車輛狀態數據,再通過編寫一套完整的算法邏輯,精確地判斷每一個行程過程,并將其記錄。
2)提升數據分析效率:對每輛車上傳的車聯網數據,將其以單個行程為顆粒度聚合,即將每天1萬多條的數據匯總成幾條行程數據,通過分析用戶的行程數據,即可快速提取用戶特征值,極大地提升了數據分析效率。
3)為標簽體系建設打下基礎:判斷出一個完整的行程后,在單次行程中通過算法設計、算法開發以及離線任務計算,可獲得更多有價值的數據,例如行駛里程、時長、速度等,這些計算好的數據稱之為標簽。將各類標簽進行整合加工,同時對標簽屬性加以定義,建立起標簽之間的網絡聯系,從而搭建起一個完善、動態的標簽體系。
3? 算法設計
由上一章節,本課題的主要目標為:基于車聯網大數據,通過算法設計來判斷車輛的行駛過程,將CAN信號數據匯總成行程數據。
3.1? 純電動汽車整車上下電的流程
在上電流程中,首先是VCU被喚醒(鑰匙喚醒、網絡喚醒、或者充電cc信號硬線喚醒),啟動后發送請求閉合HVIL回路使能線和必要的12V低壓繼電器的CAN報文,同時監控HVIL回路狀態,然后DCU、DC/DC、BMS被喚醒(VCU發送的網絡管理報文或者IG ON信號喚醒)并進行自檢,監控HVIL回路狀態,對于BMS還需計算絕緣阻值,確認絕緣是否正常,無故障后進入待機模式(standby狀態)。隨后VCU請求BMS閉合主繼電器,BMS則先后閉合主負繼電器和預充繼電器,當檢測到母線電壓達到閾值后,判斷預充電成功,然后閉合主正繼電器,并斷開預充繼電器,則高壓上電完成。
在正常下電流程中,當檢測到鑰匙信號、硬線信號關閉或網絡喚醒信號停發,VCU立即請求DCU離開工作模式,并且功率器件迅速降低功率,隨后VCU請求DC/DC離開工作模式,然后VCU在請求BMS斷開高壓繼電器,BMS完成響應后,VCU斷開HVIL回路和低壓繼電器,各節點進入下電休眠流程。
在車輛上下電的過程中,還可能包含著車輛行駛過程,即車輛上電后,有可能行駛一段時間后再下電,也有可能一直保持靜止直至下電。基于整車上下電的原理,整個行程識別算法設計將車輛的單次行程過程劃分為4個時間節點:車輛上電、車輛行駛開始、車輛行駛結束、車輛下電。
3.2? 算法整體設計思路
按照數據上傳的時間先后順序,依次讀取整車CAN信號數據。在遍歷數據的過程中,首先判斷數據是否滿足車輛上電條件,當讀取到數據滿足車輛上電條件時,記錄車輛上電時間,同時開始計算行程數據。在車輛上電時間之后,依次判斷車輛行駛開始條件、車輛行駛結束條件、車輛下電條件,當判斷到滿足車輛下電的條件時,整個行程過程結束。以上4個節點的判斷算法如下。
1)車輛上電判斷:按照整車CAN信號數據上傳的先后順序,依次讀取數據,當讀取到某一條數據滿足整車高壓狀態為“動力預備”且電池包主正繼電器連接狀態為“連接”時,判斷此時車輛處于上電狀態,首條滿足上電狀態條件的數據對應的數據采集時間定義為車輛上電時間。
如圖1所示,車輛在11:07:53時首次滿足整車高壓狀態=“動力預備”且電池包主正繼電器連接狀態=“連接”,則該車輛的上電時間為2022/5/9 11:07:53。
2)車輛行駛開始判斷:車輛上電后,在判斷到車輛上電后,持續判斷至數據滿足整車高壓狀態為“動力預備”且整車運行狀態為“行駛”且整車車速>0時,車輛開始行駛,其對應的首條數據采集時間定義為車輛行駛開始時間。
如圖2所示,車輛在53s時上電,但車速=0,即表示此時車輛屬于靜止狀態;在55s時車速=0.28125km/h且整車運行模式=“行駛”,表示此時車輛處于行駛狀態,則車輛行駛開始時間為2022/5/9 11:07:53。
3)車輛行駛結束判斷:若車輛下電時間對應的整車車速≠0(此時可能是車輛上傳數據丟失導致,也可能是因為數據采集頻率導致),則車輛行駛結束時間=車輛下電時間。
如圖3所示,車輛在17:44:19時的車速為0.484375km/h,表示在數據上傳時車輛仍處于運行狀態,但此時車輛已下電,所以車輛行駛結束時間應等于車輛下電時間。
若車輛下電時間對應的整車車速=0,則在車輛行駛開始時間至下電時間中尋找滿足整車車速全部=0的最后一個片段,該片段的首條數據采集時間為車輛行駛結束時間。
如圖4所示,車輛在11:09:39時下電,且下電時對應的車速為0,從下電時間往前判斷,發現從11:09:19開始至下電時間,車速全為0(車輛一直處于靜止狀態),說明車輛在11:09:19時已行駛結束。
4)車輛下電判斷:若前后2條數據時間間隔≤60s,則滿足整車高壓狀態為“動力斷開”且整車運行狀態不為“行駛”持續時長>6s(防止數據出現跳變)的首條數據為下電時間。
如圖5所示,車輛在11:09:39滿足下電條件且一直持續至11:09:47(持續時間大于6s),則11:09:39為車輛下電時間。
若前后2條數據時間間隔>60s(數據存在丟失情況),則取數據丟失前的末條數據時間為下電時間。
如圖6所示,車輛在17:44:31時仍處于上電狀態,但由于數據丟失,下一條數據上傳時間為19:28:03,此時車輛數據上傳時間間隔大于1min,則認為在數據丟失前車輛已行駛結束,17:44:31為車輛下電時間。
本算法將車輛的單次行程過程細分為4個階段:上電、行駛開始、行駛結束、下電,通過4個時間節點完整且精確地表達了一次行程過程。同時,基于車聯網大數據,通過算法邏輯將幾萬條底層數據計算成幾條行程數據,以行程為最小顆粒度來存儲車輛數據,既節約了存儲成本,又提高了數據查詢效率。
圖7為某臺車5天的數據量,共計40500條,通過行程算法計算后,可將該4萬多條的數據濃縮成22條行程數據存儲,如表1所示。再基于每次行程中計算車輛的各種數據,可以一條數據來表征用戶駕駛行為。
4? 總結
本課題針對整車CAN信號數據,設計出一個基于車聯網大數據的純電動汽車行程識別算法,該算法可帶來許多有益的效果。
1)精準識別用戶的每一次行程,解決底層數據無法直接分析的難題。
2)通過算法將底層數據匯聚成行程數據,數據量可由原先的十億數量級降低至百萬數量級。以行程為單位存儲車聯網數據,極大地降低了存儲成本,同時提升了數據查詢和數據分析效率。
3)基于單次行程,可計算出各類數據標簽,這些標簽表征了用戶的駕駛特征,通過建設標簽體系,將盡可能多的標簽數據通過各種各樣的方式組合,可得到不同的用戶畫像,從而賦能業務實現用戶精細化運營和精準營銷。
參考文獻:
[1] 蒲文杰,張戈,陳雙雙. 分析大數據在車聯網中的應用[J]. 重型汽車,2021(6):37-38.
[2] 吳金. 車聯網大數據處理系統的設計分析[J]. 電子技術,2020,49(7):178-179.
[3] 安婧. 大數據在車聯網中的應用探究[J]. 計算機產品與流通,2018(4):252.
[4] 芮祥麟. 大數據在車聯網中的應用[J]. 軟件和信息服務,2015(3):61.
(編輯? 楊? 景)
作者簡介
卓麗(1999—),女,助理工程師,主要從事車聯網大數據應用相關工作。