張碩
DT時代,數據的價值已經毋庸置疑。如何最大限度挖掘數據價值,提供更為優質、有效的數據,成為現階段整車廠商和服務商越來越重視的問題,數據的采集、處理、分析、應用每一個環節都不容忽視。
作為車聯網應用的基礎,數據采集端也吸引了不少玩家進入。
當前車聯網市場數據收集方式主要有三種:一是以OBD等后裝硬件作為數據收集載體,博泰的iVoka Mini 、騰訊的路寶盒子等都屬于OBD產品;二是以手機APP為數據收集方式,比如“斑馬行車”APP;三是基于T-Box、車機等前裝設備,通過汽車CAN總線讀取數據。
除了數據采集手段有差異,數據采集規范也各不相同,并且對于數據項的定義沒有統一標準,很多數據或重復采集,或無法直接產生價值,或后期改造周期較長,數據維護成本高。這不僅造成資源浪費,也無法滿足整車廠或第三方服務商的需求。
2016年12月2日下午,定位于前裝車聯網大數據服務運營商的彩虹無線聯合上汽、廣汽、東風日產、北汽、奇瑞、眾泰、遠特科技等22家汽車廠商及車聯網軟硬件服務平臺,共同推出了前裝車聯網數據采集標準建議。
在彩虹無線創始人黃亮看來,數據采集的類別和精度直接影響到數據的質量,而數據質量是大數據運營和服務的根本,否則無法建立相關數據的基礎業務模型。
具體來講,彩虹無線的數據標準就是通過規范數據的采集內容和頻率,統一定義數據項的編碼和描述以及數據的單位、精度。
那這項采集標準是如何制定出來的?
彩虹無線技術負責人祁超說,從保險和數據智能兩個應用方向以及十多個應用主題出發,該采集標準基于10萬輛車兩年的數據周期進行模型的驗證和應用,同時聽取了30多家車廠和保險公司的意見,參考了5部以上國內外的標準,歸納總結了135個數據項。
彩虹無線將這些數據項分為屬性類(包括時間、位置、標識)、行為類(速度、操控等)、車況類(動力、底盤、車身、內外飾、電子電器等)、環境類(內外部環境)四大類別,以及來自CAN總線、G-sensor加速度感應器、定位芯片、服務云端四個數據源。
通過對不同的業務需求建立相應的數據模型,如UBI定價模型、碰撞識別模型、理賠反欺詐模型、整車性能評估模型、故障預警模型等,并以此分析所需要的各項數據,以及各項數據所需要的精度和采集周期頻率。
以UBI產品當中的駕駛安全評級模型為例,主要從駕駛平穩性、出行習慣、出行強度、駕駛規范性、激烈駕駛5個維度進行分析,每個維度還包括一系列風險因子:平均速度、是否超速、頻繁變道、急加/減速、急剎車等,不同的風險因子還要有不同角度的數據來衡量。
比如平均速度一項,需要綜合時間和車速形成的數據流來進行統一編碼,包括數據采集時間、數據上傳時間、服務器接收時間、GPS車道、輪速傳感器車道、變速箱輸出軸車道等。甚至一些高頻數據需要一秒鐘一次的采集頻率,如此才能夠準確分析駕駛行為。
如果前期車聯網建設過程中對于T-BOX數據采集的規范沒有嚴格的定義,那么在精度上就會存在不足,這意味著數據對于保險產品的定價缺乏指導性。
車載信息服務產業應用聯盟秘書長龐春霖亦認為,數據采集標準是車聯網數據能夠發揮作用的前提,其大規模應用有利于推動產業的發展。
從實際應用來看,采集端的數據關系到各家車廠私有協議,制定數據標準會有一定難度,目前主要是以滿足應用端為目的。在應用端,車聯網的數據標準會分幾個層級分別制定,除了UBI,交通安全、V2X也都需要統一的數據標準,行業各參與者都在摸索和嘗試中。
對于彩虹無線而言,率先發聲或可推動行業標準快速制定,更重要的是,可以在行業掌握一定的話語權。
2016年12月14日,中國保險信息技術管理公司牽頭,聯合多家行業單位開會啟動研討車聯網數據保險應用研究項目。《汽車商業評論》了解到,包括彩虹無線在內共有4家車聯網公司參與到這個項目中,上海評駕科技和人保財險共同為標準組組長。