隨著汽車朝著智能化的方向進行發(fā)展,大數(shù)據(jù)分析技術(shù)在汽車領(lǐng)域的應(yīng)用也越來越普遍。本文介紹幾種大數(shù)據(jù)在汽車相關(guān)方面的應(yīng)用。
通過無線連接的汽車數(shù)據(jù)傳輸通信技術(shù),能夠支持車載遠程信息技術(shù)服務(wù)。該項技術(shù)能夠在合理的時間范圍內(nèi)有效處理大量的控制器區(qū)域網(wǎng)絡(luò)(CAN)總線數(shù)據(jù)。這些數(shù)據(jù)對于很多聯(lián)網(wǎng)汽車的應(yīng)用程序來說是必不可少的,因此通過Hadoop框架查詢和提取有用信息將有助于提高安全性和駕駛性能體驗。通過實施分布式計算系統(tǒng)模式分析CAN總線數(shù)據(jù),產(chǎn)生托管在云里的有效數(shù)據(jù)。此外,利用一個移動應(yīng)用服務(wù)程序?qū)偩€數(shù)據(jù)進行收集和傳輸,并將數(shù)據(jù)傳輸?shù)竭h程數(shù)據(jù)中心。目前遠程數(shù)據(jù)中心包括應(yīng)用服務(wù)器和Hadoop生態(tài)系統(tǒng)蜂窩數(shù)據(jù)倉庫。通過實驗進一步表明,相對于統(tǒng)計分析系統(tǒng)(SAS)框架和HiveQL聲明性語言,MapReduce連接算法是高度可伸縮的,并針對分布式模式進行了優(yōu)化計算。
車輛數(shù)據(jù)的收集與分析可以讓對汽車生態(tài)系統(tǒng)感興趣的汽車制造商、汽車維修商、道路和運輸部們對服務(wù)機構(gòu)進行支持。這些都會提高汽車的安全駕駛性能,但車主訂閱了這項服務(wù),也許將產(chǎn)生一定的費用。

Figure 4.Processing vehicle’s engine data using Hadoop and MapReduce based on the proposed Monitoring and Analytics framework.
隨著Hadoop平臺項目的開發(fā),使用Hadoop集成的開源軟件,構(gòu)建大數(shù)據(jù)解決方案是目前來看是可以實現(xiàn)的。在這篇文章中,基于大數(shù)據(jù)技術(shù),作者創(chuàng)建了一個監(jiān)視和分析框架,通過Hadoop處理汽車相關(guān)數(shù)據(jù),例如處理發(fā)動機數(shù)據(jù)(見文中Figure 4),實現(xiàn)處理結(jié)果有效。對汽車制造商、運輸、緊急服務(wù)等第三方服務(wù),允許通過網(wǎng)絡(luò)訪問有用的信息。使用MapRe?duce編程模型和Apache蜂巢與SAS程序。未來的研究重點將集中在評價遠程車輛的性能,診斷遠程車輛以及特定的聯(lián)網(wǎng)汽車應(yīng)用程序等方面。
互聯(lián)智能汽車的連通性可以概括為車輛到車輛(V2V)、車輛到基礎(chǔ)設(shè)施(V2I)和車輛到一切(V2X)三個方面提供。V2X的整體概念是在車輛和所有其他實體之間進行通信,包括行人和移動設(shè)備等,V2X涵蓋了智能汽車連通性的廣泛方面,由于IEEE 802.11p和DSRC的短距離連接的限制性,促使研究人員探索新的通信技術(shù)。據(jù)作者經(jīng)驗,最快的無線網(wǎng)絡(luò)是LTEAdvanced(LTE-A),5G網(wǎng)絡(luò)是一個全球正在進行的研究領(lǐng)域。此外,預(yù)計5G技術(shù)將為車輛智能連接帶來新的功能寬帶,包括超低延遲和無限連接。作者提出了互聯(lián)系統(tǒng)架構(gòu)和設(shè)計方案(文中Figure 4),這為大數(shù)據(jù)分析提供了基礎(chǔ)。通過eNB實現(xiàn)V2V和V2I,再經(jīng)過LTE EPC與另一eNB連通實現(xiàn)V2X,包括V2P、V2D、V2H。其中演進分組核心(EPC)是一種向4G LTE網(wǎng)絡(luò)提供數(shù)據(jù)和融合語音的框架,eNB是實現(xiàn)與移動設(shè)備通訊的基站,RSU是實現(xiàn)與車連通的路邊裝置。

NREL的研究人員使用一組8個指標來描述每一個驅(qū)動循環(huán),通過聚類分析,主要成分分析(PCA)和交叉相關(guān)分析,用來確定其中的哪8個指標提供了最多的信息支持細分車輛驅(qū)動模式。集群分析被用來確定車輛行駛的最優(yōu)分組周期指標。最后,重新抽樣方案是研究了樣本偏差對其可能產(chǎn)生的影響,車隊DNA數(shù)據(jù)建立在結(jié)果分割的基礎(chǔ)上。在這個分析中,NREL每天使用從913輛車中的16,250個驅(qū)動循環(huán)。在這些車輛中,108(5 071個周期)是有臥鋪的長途卡車,754(10 765)如文中FIGURE 1所示的職業(yè)車輛。也包含了在數(shù)據(jù)庫中有51輛車(414個周期)被分類為未知職業(yè),但擁有驅(qū)動循環(huán)數(shù)據(jù)。

FIGURE 1 Sample composition
在這項研究中,車隊DNA數(shù)據(jù)庫繼續(xù)進行生長。執(zhí)行分析,為了支持未來的分析,已經(jīng)開始開發(fā)在車隊DNA大數(shù)據(jù)應(yīng)用程序編程接口中,它提供了簡化的存儲、聚合和分析,使用行業(yè)標準大數(shù)據(jù)框架的函數(shù),利用分布式處理庫Spark和Hadoop分布flesystem。研究展示了一種新的分析方法驅(qū)動循環(huán)動力學的結(jié)構(gòu)和模式。因此,利用了一個可擴展的數(shù)據(jù)框架和一個大的以及不同的數(shù)據(jù)集,913個獨特的商業(yè)車輛的驅(qū)動循環(huán)數(shù)據(jù),包括16,250天的操作。作者的方法利用聚合特征提取、k-medoid聚類、以及NREL驅(qū)動工具來實現(xiàn)基本模式在這個群體的駕駛特性中車輛。結(jié)果描述了代表性的驅(qū)動周期在兩個(或三個)的職業(yè)車輛中。
考慮到有效的動力系統(tǒng)控制和實施駕駛輔助功能,司機的駕駛行為及駕駛特性的影響起著越來越大的作用。面對一個廣泛的駕駛特性,現(xiàn)代智能汽車必須能夠在各種情況下做出正確回應(yīng),駕駛模式不僅依賴于司機的駕駛行為,同時和道路特征、環(huán)境邊界條件和其他方面有很強的關(guān)系。駕駛模式主要受交通信號燈控制的樞紐密度、速度限制、街道功能和類型等控制。因此,為了全面分析某駕駛員的駕駛模式,盡可能的考慮駕駛情況是非常必要的?,F(xiàn)如今,在考慮駕駛情況和環(huán)境邊界條件下,有效的大數(shù)據(jù)技術(shù)可以用來支撐駕駛模式的調(diào)查研究。
在考慮驅(qū)動模式相關(guān)參數(shù)如加速度等額外因素的驅(qū)動模式下,提出了一種用于集群和評估的方法。在所引入的計算方法的第一步驟中,對所涉及的車輛的訪問數(shù)據(jù)進行收集,并對每隔一公里的驅(qū)動段進行分段。這些信息包括車輛行駛路程、行駛速度、加速度以及汽車所處的經(jīng)緯度。第二步,基于駕駛段,建立反應(yīng)駕駛環(huán)境的初始特征矩陣。隨后,為了減少計算的復(fù)雜度,在這個初始特征矩陣上進行主要成分分析,從而減少矩陣的維數(shù)。第三步,通過K值平均算法將駕駛環(huán)境分成三個類別,分別是山地路形、曲折路形、以及平坦路形。最后,將加速度、減速度的標準偏差對當前汽車所處的駕駛模式進行區(qū)分。標準偏差用于將集群驅(qū)動模式分為三個集群(例如,平靜、標準和侵略性等三個模式)。
研究結(jié)果表明,駕駛環(huán)境受到許多變量的影響。描述司機和車輛的周邊環(huán)境包括道路等級、交通狀況和司機的行為本身。根據(jù)駕駛環(huán)境的不同類型和特點,駕駛模式“數(shù)值解”也非常多樣化。駕駛情況信息以及駕駛驅(qū)動模式有助于動力總成優(yōu)化和控制策略的制定,并能夠向高級驅(qū)動程序控制輔助系統(tǒng)提供更多的更準確的反饋信息。此外,這些信息還可以支持車輛的安全處理和控制。通過這種引入的方法提供一組精確的識別駕駛的客觀標簽?zāi)J?,支持未來智能汽車的發(fā)展和控制。
把汽車周圍環(huán)境中可用的各種數(shù)據(jù)源作為輸入,以預(yù)測駕駛員的意圖和行為。作為調(diào)查這些潛在的數(shù)據(jù)源的一部分,作者進行了大量的電子日歷上的實驗,并回顧了一些可用的地理參考系統(tǒng)。通過統(tǒng)計分析,計算位置識別精度結(jié)果,探討了日歷位置數(shù)據(jù)的潛在利用率來檢測駕駛員意圖。為了利用在現(xiàn)代車輛中可用的多種多樣的數(shù)據(jù)輸入,提出了一種新的模糊計算建模方法。因為大數(shù)據(jù)和物聯(lián)網(wǎng)的優(yōu)勢,開發(fā)利用智能系統(tǒng)和計算技術(shù)的需求越來越大,這可以降低復(fù)雜性以及在獲取和處理大量的信息方面的認知負擔。研究結(jié)構(gòu)如下:
第一步,識別各種信號和輸入,這些信號和輸入可以被計算機系統(tǒng)利用,以便自動識別駕駛員的意圖和行為。
第二步,詳細地研究了這些數(shù)據(jù)源中的一個。使用多個統(tǒng)計度量,借助于分類性能分析,研究利用電子日歷和地理位置信息來識別駕駛員的位置的潛力。通過這一分析,以揭示司機的意圖旅行到某些目的地。
第三步,提出了一種新的模糊計算建模方法,應(yīng)對和處理來自多個和多種數(shù)據(jù)源的大量數(shù)據(jù)。研究了在新興的大數(shù)據(jù)和物聯(lián)網(wǎng)技術(shù)革命的范圍內(nèi)預(yù)測駕駛員意圖和行為。
這項研究可以通過技術(shù)增強和相互關(guān)聯(lián)的環(huán)境來實現(xiàn),無論是在現(xiàn)代車輛內(nèi)部還是外部,都提供了包含大量信息的多個數(shù)據(jù)源。確定并突出數(shù)據(jù)源,重點在預(yù)測駕駛員的預(yù)期目的地、行為、情感/認知狀態(tài)和偏好的領(lǐng)域。其中的研究范圍之一是探索不同輸入源的利用潛力。
為了實現(xiàn)這一目標,詳細調(diào)查了其中一個來源,即電子日歷,電子日歷作為數(shù)據(jù)源來探索,這有助于預(yù)測駕駛員的下一個目的地。為了實現(xiàn)這一目標,分析了來自美洲虎路虎員工使用的群件日歷的數(shù)據(jù),這些數(shù)據(jù)提供了關(guān)于一般電子日歷使用的一些有趣的統(tǒng)計事實。還研究了準確地識別地理位置的潛力,借助于詞匯來描述從電子日歷條目中獲取的事件的位置。總結(jié)這些結(jié)果,可以得出結(jié)論,利用電子日歷信息可以提高預(yù)測駕駛員下一個目的地的準確性,實驗的數(shù)據(jù)融合成功率保持在92%以上。
為增強預(yù)測駕駛員意圖和偏好的能力,提出了一個最先進的模糊計算模型。其目的是整合多個數(shù)據(jù)源,如電子日歷數(shù)據(jù),并利用現(xiàn)代連通性增加的優(yōu)點,使車輛能夠訪問豐富的信息源,如社交網(wǎng)絡(luò)、其他智能車等。所提出的框架有可能導(dǎo)致對社會、經(jīng)濟和個體駕駛員產(chǎn)生重大影響。這可以通過開發(fā)應(yīng)用程序來實現(xiàn),該應(yīng)用程序(流程圖見文中Fig.2)利用預(yù)測的駕駛員意圖、特征,現(xiàn)代車輛的性能和汽車的能力與其他外部、數(shù)字實體通信。這些應(yīng)用有望改變駕駛員與車輛交互的方式,優(yōu)化車輛的整體性能,甚至有助于改善交通管理和智能城市內(nèi)的能源資源。這些功能可以通過先發(fā)制人的衛(wèi)星導(dǎo)航系統(tǒng)來實現(xiàn)?;旌蟿恿囕v電動列車運行的優(yōu)化配置、降低CO2排放量、超前車輛預(yù)處理(加熱/冷卻/除冰)、電動車輛充電優(yōu)化和有效的電網(wǎng)管理,駕駛員識別和車輛個性化。

Fig.2.Predicting destination based on user and activity data[43].