宋建國
(吉林工程技術師范學院, 吉林 長春 130062)
車聯網大數據是車輛電氣化與互聯網聯合發展的新型工業領域[1]。隨著車聯網的不斷發展,數據越來越龐雜,由此帶來了傳輸數據速度、數據信息不透明、數據泄露和數據安全等問題[2]。針對上述問題,本文提出了基于關聯規則的車聯網信息數據加密技術,用于提高數據加密效果、提高數據傳輸速度。
車聯網作為一種新型通信技術,為車載設備提供多種服務,包括車輛保養、金融服務和車載娛樂等。為了保證車聯網大數據的信息安全,無權限的第三方不會被泄露信息,需要建立基于關聯規則的車聯網大數據,以實現多用戶多節點傳輸數據。
假設Q為車聯網數據集,W為各項事務,每個事務ri都各自具有唯一獨立的標識,Y={y1,y2,…,yn}為不同事務的組合。若A為一個項目集合,項目屬于事務,則事務包含于項目集合。對于A的支持度sup(A),通常用車聯網數據中A所占車聯網數據集Q的占比來表示。如果A是一個頻繁項集,則項目集合A的支持度應大于任意項集中的最小數值。而對于A的置信度,通常用車聯網數據中心項目集A和項目集B的支持度與項目集A比值來表示,即:
車聯網數據挖掘相關規則包含公用聯網和車聯網兩部分。以此為基礎,車聯網可進一步細分為車載節點、通信基站和其他車輛網絡節點,這些節點分別具有自身獨立的關聯規則。關聯規則中,為了提升車聯網大數據的精準度,需要提高關聯規則的提升度。提升度為:
式中:P(A)和P(B)為項目集A和項目集B被挖掘的概率。在關聯規則中,提升度在[-1,1]之間變化。
根據式(2)可以得知,若計算結果為0,此時關聯規則中的提升度并未在項目集A和項目集B的數據挖掘中起作用。若計算結果在[-1,0)之間,此時關聯規則中的提升度在項目集A和項目集B的數據挖掘中起到反作用。若計算結果在(0,1]之間,此時關聯規則中的提升度在項目集A和項目集B的數據挖掘中起到正作用。從以上分析可以看出,為了使關聯規則在數據挖掘中起到正作用,在計算過程中,若結果計算出為0,則這部分數據將馬上被剔除。此外,將提升度>0 的路側車聯網設備和通信基站等邊緣節點進行統一標識,以實現數據安全。
由于車聯網信息傳輸環境復雜多變,傳輸數據的加密算法與車聯網關聯規則相互結合,將更有利于大量車聯網數據的安全傳輸。基于關聯規則的車聯網信息數據加密傳輸模型示意圖,如圖1 所示。車聯網大數據在傳輸過程中,發送方和接收方之間存在一條虛擬通道,需要確認ID 和交換密鑰。其中,密鑰的交換對車聯網大數據的安全傳輸起著至關重要的作用。

圖1 基于關聯規則的車聯網信息數據加密傳輸模型
車聯網大數據信息加密分為以下4 個步驟:
1)數據分割,利用協議標頭進行包裝。數據傳輸過程中,為了實現數據的保護,需要結合關聯規則對安全協議數據安全進行設計。安全協議數據單元主要包括協議明文頭、協議保護頭、協議用戶數據和協議完整性校驗閾值。協議明文頭由初始化向量和Internet 協議編號構成。協議保護頭的作用為信息鑒別,方式為對通信系統源目標地址進行封裝。協議完整性校驗閾值通過哈希函數將有效數據進行包裝,即報文匯總。
2)接收方接收來自發送方的數據。數據經過DES密鑰加密,接收方接收后進行分組處理并獲得信息。通過對車聯網大數據信息進行統計,甄別需要加密的數據,并對其進行數字簽名,數據處理后發送至網關進行身份驗證,通過查驗車聯網發送的簽名和密文確認身份。若查驗正確,接收方可以接收車聯網傳輸的大數據信心,否則,拒絕接收。
3)車聯網大數據信息交換,實現車輛與車輛之間的通信。為了實現上述功能,需要對車聯網大數據進行加密并傳輸。通常情況下,通信系統會將車聯網大數據信息傳輸給通信區域內的車輛,邊界節點會將信息直接傳輸給相鄰節點,并將相關傳輸信息上傳到服務器。通過對車聯網大數據的協同傳輸和配合,可以查詢其他相關的關聯節點,以應對突發情況。
4)接收來自發送方的車聯網大數據信息。重復步驟1)—3),最終實現車聯網大數據的全部數據傳輸。車聯網大數據信息在傳輸過程中,不可避免會出現數據傳輸錯誤等問題。因此,傳輸協議要包含容錯性。
基于關聯規則的車聯網信息加密具有傳輸速度快、信息安全性高的特點。為了驗證上述優點,以某市實際公共交通GPS 資料為基礎,對比基于區塊鏈保護的車聯網大數據傳輸模型、基于云邊融合的車聯網大數據傳輸模型和本文提出的基于關聯規則的車聯網信息加密傳輸模型。以上3 個模型的最高吞吐量分別為400 kb/s、260 kb/s 和480 kb/s,可以看出,基于關聯規則的車聯網信息加密傳輸模型吞吐量明顯高于其他模型,加密傳輸更安全、更穩定。
車聯網大數據信息傳輸速率和信息安全性對車聯燃油經濟性也有一定影響。通過車載終端定期采集、實時傳輸獲得大量數據,運用統計學的方法分析其燃油經濟性。傳輸延時是影響燃油經濟性的關鍵因素,大數據的精準傳輸可以避免計算誤差,對提高駕駛員操作判斷精確性、降低車內儀表故障發生率以及優化車載運行工況具有積極作用。基于區塊鏈保護的車聯網大數據傳輸模型、基于云邊融合的車聯網大數據傳輸模型和本文所提的基于關聯規則的車聯網信息機密傳輸模型的傳輸延時對比圖,如圖2 所示。可以看出,基于區塊鏈保護的車聯網大數據傳輸模型和基于云邊融合的車聯網大數據傳輸模型延遲高于5 s 的節點數,明顯多于本文所提出的基于關聯規則的車聯網信息加密傳輸模型。

圖2 傳輸延時對比
傳輸延遲對燃油經濟性存在影響。3 種傳輸模型的燃油經濟性對比,如表1 所示。可以看出,基于區塊鏈保護的車聯網大數據傳輸模型、基于云邊融合的車聯網大數據傳輸模型和本文所提出的基于關聯規則的車聯網信息加密傳輸模型的平均百公里耗油量分別為6.69 L、10.40 L 和6.54 L。基于關聯規則的車聯網信息加密傳輸模型的燃油經濟性,相較于基于區塊鏈保護的車聯網大數據傳輸模型,提高2.24%。相較于基于云邊融合的車聯網大數據傳輸模型的燃油經濟性,提高37.1%。

表1 燃油經濟性對比
1)本文提出了一種基于關聯規則的車聯網信息數據加密模型,可以實現車聯網大數據加密傳輸,同時,提高傳輸效率。
2)對比3 種傳輸模型,基于關聯規則的車聯網信息加密傳輸模型吞吐量最高為400 kb/s,在車聯網大數據信息傳輸過程中具有更強的穩定性,加密傳輸安全性效果良好。
3)本文所提的數據加密傳輸模型相較于基于區塊鏈保護傳輸模型和基于云邊融合傳輸模型,燃油耗能顯著降低。