方旭 朱敏 王保琴 肖春霞


摘要:有效使用車聯網和數據挖掘技術,可以使軍隊車輛在日常行駛時更加規范、安全。本文從車聯網與數據挖掘技術、技術應用的指導意義、數據挖掘技術在軍車使用情況判定中的應用等方面進行分析,對軍隊正規化管理和使用軍車具有借鑒作用。
關鍵詞:車聯網;數據挖掘;軍隊車輛
0引言
當前,隨著經濟的發展和汽車保有量的迅速增加,隨之而來的道路安全和擁堵問題日益突出。為此許多國家和地區都在大力發展智能交通系統和智能汽車技術應對上述問題。在遵循軍隊相關車輛規定的基礎上,通過車聯網和數據挖掘技術的應用,對駕駛員的習慣進行規范,從而使軍隊車輛在執行部隊公務和重大演習活動時更加安全地行駛,最終圓滿完成保障任務,對相關職能部門來說具有很強的指導和借鑒作用。
1車聯網與數據挖掘技術
1.1車聯網
車聯網是指利用通信、互聯網、物聯網等技術將各種車輛進行聯網進而展開各種綜合廣泛應用,包括智能交通、汽車互聯網及其應用、汽車通信網及其應用等。采用各種技術手段將車與車、車與人進行連接是其技術存在形式,在此基礎上發展形成的各種產品與服務是車聯網的核心。
歐美等汽車工業比較發達的國家,無論是在整體規劃還是在技術開發和應用方面,都引領著全球車聯網技術的發展,并取得了顯著的成績。2009年12月,美國交通部發布了《職能交通系統戰略研究計劃:2010-2014》,首次提出了車聯網的構想;2014年美國國家高速公路安全管理局發布兩份文件,就車隊車技術標準對外征求意見,并促請立法。我國車聯網已被列入重大專項,稱為十二五期間的重點項目,獲百億元支持,而國家對車聯網行業規范也逐漸重視起來,政府在產業規劃、技術標準等多方面的支持將大大推進汽車物聯網長夜全面鋪開和提速。
車聯網系統有三個要素,第一個要素是“端”,即車載終端上的RFID、雷達、攝像頭等傳感器,其作用是采集車輛信息和感知當前車輛行駛狀態,并能與人和車進行交互,提供最直接的用戶體驗。第二個要素是“管”,即實現融合通信和接入互聯網的能力,主要是把“端”采集和感知的人與車、車與車、車與路等信息接入網絡和互聯互通。第三個要素是“云”,即負責監聽“端”和“管”發來的連接請求,提供高效、穩定的數據存儲、處理、分析,最終為交通參與者提供服務。
1.2數據挖掘技術
數據挖掘是指從大量的數據中通過算法搜索隱藏于其中信息的過程,其定義是從海量數據中找到有意義的模式或知識,作為計算機科學的一個學術領域,基于數據庫理論,機器學習,人工智能,現代統計學的迅速發展的交叉學科,在很多領域中都有應用。涉及到很多的算法,源于機器學習的神經網絡,決策樹,也有基于統計學習理論的支持向量機,分類回歸樹,和關聯分析的諸多算法。
CRISP-DM(cross-industry standard process for data mining),即為”跨行業數據挖掘標準流程”,提供了一個數據挖掘生命周期的全面評述,包括項目的相應周期,它們的各自任務和這些任務的關系。所有數據挖掘任務之間關系的存在是依賴用戶的目的、背景和興趣,最重要的還有數據。它為一個KDD工程提供了一個完整的過程描述。該模型將一個KDD工程分為6個不同的,但順序并非完全不變的階段,所示如圖1。
(1)商業理解、數據理解和數據準備是數據挖掘的第一個大的步驟,其中商業理解要求在理解項目目標和從業務的角度理解需求,同時將這個知識轉化為數據挖掘問題的定義和完成目標的初步計劃。數據理解階段從初始的數據收集開始,通過一些活動的處理,熟悉數據,識別數據的質量問題,首次發現數據的內部屬性,或是探測引起興趣的子集去形成隱含信息的假設。數據準備是數據挖掘前期一個非常重要的步驟,數據準備的好壞直接影響了數據挖掘的效率和準確度以及最終模型的有效性。數據準備階段包括從未處理數據中構造最終數據集的所有活動。這些數據將是模型工具的輸入值。
(2)建模是數據挖掘最為核心的步驟,在這個階段,可以選擇不同的模型技術,模型參數被調整到最佳的數值。一般,有些技術可以解決一類相同的數據挖掘問題。目前常用的技術有:關聯規則、決策樹、分類、聚類、粗糙集、神經網絡、遺傳算法等。
(3)評價階段是在開始最后部署之前,檢查構造模型的步驟,確保模型可以完成業務目標。這個階段的關鍵目的是確定是否有重要業務問題沒有被充分的考慮。在這個階段結束后,一個數據挖掘結果使用的決定必須達成。
(4)最后是部署階段。通常,模型的創建不是項目的結束。模型的作用是從數據中找到知識,獲得的知識需要便于用戶使用的方式重新組織和展現。根據需求,這個階段可以產生簡單的報告,或是實現一個比較復雜的、可重復的數據挖掘過程。在很多案例中,這個階段是由客戶而不是數據分析人員承擔部署的工作。
2技術應用的指導意義
隨著北斗系統的裝配和相關用車規章制度的不斷健全,軍隊特種車輛和軍隊公務用車的車輛派遣、調度、行駛路線、車輛狀況、道路實時路況和對駕駛員能力的考核等日趨規范。但從實際來看,車輛行駛過程中還會遇到很多復雜情況,比如我院(文中出現的“我院”、“學院”等均指中國人民解放軍重慶通信學院)位于歌樂山腹地,山路窄、陡坡多、坡度大、人流量復雜,加之重慶地區城市道路較為擁堵,部分私家車、出租車、大貨車、行人不遵守交通規則等等,駕駛員即使駕駛水平再高,如果駕駛行為習慣和心態不好,極有可能在執行駕駛任務時出現行車危險并大幅縮短軍車使用壽命。
數據挖掘技術可以通過挖掘研究對象的個體特征,發現研究群體的發展變化趨勢,發現具有不同特征的數據子集之間的關聯,最終實現科學預測未來某種事件發生的概率?;谲嚶摼W進行科學采集和分析數據是提供數據和預測依據、改進駕駛員日常駕駛習慣的堅實基礎,而改進駕駛習慣首先要找出問題所在。通過深入分析挖掘駕駛習慣信息,有針對性地設計“軍車使用情況評定”是駕駛員改正不良駕駛習慣的重要途徑,是保證軍隊車輛安全使用、安全出行的有效辦法。
3數據挖掘技術在軍車使用情況判定中的應用
目前,基于駕駛行為的車險(UBI)正在逐步取代傳統車險。美國、歐洲、日本等國的多家保險公司通過駕駛員的智能手機中的傳感器或者車載設備(如OBD)上傳的數據來評測駕駛員的駕駛行為,進行風險評估,以此來判定保險費用。對駕駛習慣良好的車主給予一定的保費優惠或折扣,而另一部分經常違章、暴力駕駛等駕駛行為不良的車主,其潛在行車風險大,理賠成本高,需繳納的保費高。車輛行駛過程中,車載設備時時刻刻采集車輛的位置信息、車況和行車信息并上傳到云端,產生的數據量相當龐大,且數據類型復雜。云平臺接收客戶端發來的數據請求,展開數據挖掘。通過對這些大數據進行挖掘和分析,準確地獲取評估車輛狀況、駕駛行為,劃分車主的風險類別,從而給決策者提供有價值的信息。
本文借鑒UBI的成功經驗,以模擬學院軍隊車輛日常使用產生的數據為樣本,利用數據挖掘技術中的決策樹算法來挖掘軍車日常使用情況(文中出現的車牌、駕駛員姓名等一切數據信息均僅為測試使用)。根據車輛行駛時駕駛員容易出現的不良駕駛行為,重點對超速、激烈駕駛(急加速、急轉彎、急剎車)、闖黃燈、壓實線、變道轉彎不打轉向燈、不合理使用遠光燈等情況進行權重預處理,然后建立合適的數據模型進行決策樹算法分析。決策樹模型如圖2所示。
大部分專業駕駛員的素質和駕駛技術都是過硬的,主要是找出行車過程中幾類不太重視或習以為常的危險不良習慣,進行有針對性的改進,從而提高行車安全性。本算法主要目的是區分出駕駛員某些習慣的好壞及嚴重程度。根據預處理好的樣本數據進行計算,結果如圖3所示。我們把分析好的結果以表格形式展示,以便管理者直觀地參考、使用。
4總結
將數據挖掘技術應用到軍車使用情況評定中,對車聯網捕捉和記錄的海量數據進行處理、分析;結合軍隊實際情況,運用了決策樹算法,尋找和發現出可能造成行車危險和大幅縮短軍車使用壽命的不良駕駛習慣,做出價值判斷和決策,從而達到規范行車習慣、保障出行安全、愛護公務用車的目的。endprint