999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

面向套牌甄別的流式計算系統

2017-04-17 05:18:26趙卓峰丁維龍
計算機應用 2017年1期

喬 通,趙卓峰,丁維龍

(1.北方工業大學 數據工程研究院,北京 100144; 2.大規模流數據集成與分析技術北京市重點實驗室(北方工業大學),北京 100144)

(*通信作者電子郵箱1790392536@qq.com)

面向套牌甄別的流式計算系統

喬 通1,2*,趙卓峰1,2,丁維龍1,2

(1.北方工業大學 數據工程研究院,北京 100144; 2.大規模流數據集成與分析技術北京市重點實驗室(北方工業大學),北京 100144)

(*通信作者電子郵箱1790392536@qq.com)

套牌車的甄別具有時效性約束。針對現有計算檢測方法中所出現的精度低、響應慢等局限,提出了一種基于實時車牌識別(ANPR)數據流的套牌車流式并行檢測方法,設計了基于路段閾值表和時間滑動窗口的套牌計算模型,能夠實時地甄別出交通數據流中的套牌嫌疑車。在Storm環境下,利用某市真實交通數據集模擬成實時交通流數據進行實驗和評估,實驗結果表明計算的準確率達到98.7%,并且一條車牌識別數據的處理時間為毫秒級。最后,在該計算模型基礎上實現了套牌車稽查防控系統,能實時甄別并展現出當前時刻城市交通網中出現的所有套牌嫌疑車。

套牌車;車牌識別;流式計算;實時性;閾值表;Storm

0 引言

套牌車是指未按照交通法規的正常程序到交通部門辦理合法的手續,通過套用別人合法車牌或者偽造虛擬車牌在道路上行駛的車輛。套牌車的出現嚴重擾亂了正常交通管理秩序和社會經濟秩序,但由于缺乏有效的套牌車稽查方法,當前套牌車的發現還主要依賴于人工手段,其發現難度大,準確率低,時效性差,導致很多套牌車仍逍遙法外。不過隨著車牌識別(Automatic Number Plate Recognition, ANPR)、RFID(Radio Frequency IDentification)[1]車牌等技術的推廣應用,使得實時獲取車輛的動態信息成為可能,為套牌車的實時甄別提供了條件。

本文結合基于車牌識別數據的車輛緝查防控系統這個實際應用,針對套牌車的實時自動甄別問題展開研究。車牌識別數據是由部署在城市道路上高清攝像頭拍攝產生的,由識別攝像頭ID、車牌號、時間戳和地點等22個屬性值構成,具有時空特性。通過對城市范圍內所有車牌識別數據的匯集,可通過時空矛盾規則自動發現有套牌嫌疑的車輛,即同一車牌號的車輛不可能在一定的時間閾值范圍內出現在兩個不同的地點。由于套牌車在道路上的出現具有隨機性,隨時都有可能出現,因此,只要道路上的高清攝像頭處于正常工作狀態,車輛識別數據就會一直持續產生,源源不斷,套牌車的計算也就一直持續進行,是交通大數據上的流式計算。流式計算是大數據計算的一種主要計算模型[2-4],適用于對數據無需先存儲,直接進行計算以及實時性要求嚴格的應用場景,可以對動態產生的數據直接進行實時計算并及時反饋結果,而且只要數據流一直產生,流式計算就不會停止,除非主動終止任務或者計算環境出現故障。

本課題在流式計算中進行基于車牌識別數據的套牌車自動甄別時,主要解決以下難點問題:1)實時性。套牌甄別出的結果數據具有時效性,套牌車出現后應該在較短的時間內甄別出來,才能協助交管部門進行交通執法,因此,本課題中面對高并發、連續不斷到達的車輛識別數據,一條數據從識別出來至完成計算處理不應該超過3 s。2)準確性。套牌甄別的正確率越高,交管部門打擊套牌現象力度越大,交通規范越好。本課題中大型城市道路上所部署攝像頭多達幾千個,在高峰期的采樣頻度為1 s/條,1 h就會產生上千萬條數據,套牌車的計算是根據其時空矛盾規則來判定的,因此不僅僅是對實時數據的計算,部分歷史數據和基礎數據也需要參與計算,參與計算數據量大,而大數據量中套牌車的信息很少,非套牌車的數據大,增加了高精度計算的難度。為此,本文在對交通流式數據處理利用套牌車時空矛盾規則做實時計算時,提出了一種基于路段閾值表的套牌甄別流式計算模型,針對歷史交通數據設計了時間滑動窗口,實現了對交通數據流中出現的套牌車的實時自動甄別。通過基于真實車牌識別數據集的測試,實驗結果表明本系統能夠持續不間斷地計算識別數據流,能夠準確地甄別出數據流中出現的套牌嫌疑車,并且每個數據項的計算處理是在毫秒級內完成。

1 相關工作

目前,針對套牌車檢測的研究越來越多,成為智能交通領域的一個研究熱點,采用的技術手段和識別方式也越來越多樣化。

文獻[1]提出基于RFID技術的檢測方法,該方法將RFID電子標簽植入車輛內,標簽內保存這輛車的車型、車輛顏色、車牌號等車輛相關信息,通過交通路口放置的電子標簽讀寫器讀取標簽中存放的車牌號等信息,然后與實際車輛的信息進行對比,從而判讀出該車輛是否是套牌車。此方法雖然可行有效,但是需要交管部門增加投入資金,花費成本高,難以大范圍推廣;而且RFID標簽需要經過車主同意配合才能實施;此外RFID電子標簽還面臨著被“克隆”的危險且標簽里面的信息容易被非法篡改,導致無法準確地判斷出套牌車。文獻[5]提出的基于光學隱碼的檢測方法是利用在車牌上采用特殊的光學材料制作的防偽信息條形碼來判斷車輛是否是套牌車。此方法雖然一定程度上克服了RFID電子標簽易被修改的缺點,降低了被“克隆”的風險,但是仍面臨的問題還是成本高、難以推廣,導致無法全面有效地甄別套牌車。文獻[6]采用基于車型識別的檢測方法,在道路上放置車牌識別工具,將識別出的車牌號和車型與車輛信息庫中的車輛信息進行比較,進而判定是否是套牌車。但是由于當今車輛車型比較單一,導致套牌識別率比較低。本文利用城市交通路網上部署的高清攝像頭實時拍攝道路上過往行駛的車輛,提取車牌識別數據,利用套牌車的時空矛盾規則對拍攝到的每一輛進行套牌車的實時甄別計算,在大大降低了檢測成本的同時提高了檢測的準確率。

文獻[7]提出一種基于MapReduce與K最近鄰搜索算法來對海量歷史數據進行短時間交通流預測的方法,雖然針對的并不是套牌車甄別的問題,但對并行處理交通數據流有一定借鑒意義。文獻[8]介紹了一種基于TP-Finder方法的套牌車查詢系統,在MapReduce框架上提出基于歷史車牌識別數據集的并行檢測方法TP-Finder,解決了大規模車牌數據集在并行處理時所出現的數據傾斜問題。文獻[9]提出了一種基于Hadoop的套牌車識別方法,將交通流數據遷移到HBase中并消減經緯度,然后初始化以監測點作為頂點集和兩兩監測點之間距離作為邊權值的帶權圖,通過計算監測點之間的最短距離以及校正因子獲取套牌嫌疑車。上述這兩種方法雖然正確率都很高,但是都是通過對大規模歷史數據進行并行計算,從而挖掘出歷史數據中的套牌車,針對的是歷史交通數據,時效性太低,無法及時地檢測出城市當前道路交通網上正在行駛的套牌車。本文實現的套牌車流式計算系統是對城市道路上攝像頭所實時識別出的車牌識別數據流進行實時接入,然后通過計算模型進行實時計算,計算結果實時反饋并進行交通布控,大大提高了套牌車甄別的時效性,能夠幫助交管部門對道路上出現的套牌車進行及時有效的處理。

如今面向大規模交通數據進行的套牌車計算都是批量計算[3],參與計算的大都是歷史數據,采用的是MapReduce計算框架[10],利用“分而治之”的思想進行分布式計算,適用于大規模歷史數據的處理,處理的都是靜態數據,無法對流數據進行處理。本課題中的套牌稽查面向的是交通流數據,進行的是流式計算,現有的大數據流式計框架有Twitter的Storm(https://en.wikipedia.org/wiki/Storm)、Spark的Spark Streaming[11]、Yahoo的S4[12]、Hadoop之上的數據分析平臺HStreaming[13],其中的主要代表是Storm和Spark Streaming。Spark Streaming是核心Spark API(Application Programming Interface)的一個擴展,數據在處理前按時間間隔保存至彈性內存數據結構——彈性分布式數據集(Resilient Distributed Dataset, RDD),通過微小批量的數據集合進行聚集運算,響應時間為亞秒級;而套牌車甄別的單條數據的處理時間是毫秒級,實時性高,因此Spark Streaming不適合用于流上的套牌甄別。Storm的計算單元是一個封裝好的元組,是一次對一條數據的計算,響應時間是毫秒級,實時性高。本文套牌車的甄別就是在Storm框架上進行實現的。Storm是一款支持分布式、開源、實時、主從式大數據流式計算系統[4,14-15],由一個主控節點(運行nimbus服務)和多個工作節點(運行supervisor服務)構成。Storm做實時計算時,首先創建一個拓撲(Topology),計算邏輯被封裝在一個拓撲對象中,一個拓撲是一個由多個Spout和Bolt節點連接成的有向圖,拓撲中的每一個節點包含處理邏輯,節點之間的連接顯示數據應該如何在節點進行傳輸。Storm開源后在互聯網領域和金融銀行領域的實時監控[16]場景中得到充分應用,例如,淘寶的蟲洞系統以Storm實時流處理為引擎,進行個性化推薦、熱門話題統計等;在銀行中處理系統內部各子系統實時信息,實現對全局的監控和各種優化;除此之外在分布式遠程調用、在線機器學習、數據抽取轉化和加載等領域[17]也得到廣泛的應用。

2 問題描述

本課題來源于某市智能交通項目,該市區交通網中的多個關鍵路口部署高清攝像頭用于自動識別過往的車輛,攝像頭每秒會拍攝多輛機動車并識別出其車牌,日常交通高峰時段每小時會產生上千萬條識別數據,識別數據項包含時間戳、監測點和拍攝照片等在內的22個屬性,本系統的套牌甄別計算涉及拍攝時間、監測點ID、識別車牌號等時間空間和實體屬性。系統對這條識別數據進行實時分析,用于甄別套牌車,整個計算過程除非系統故障或者人為中斷,否則計算一直持續進行。

2.1 相關定義

定義1 監測點。城市道路中攝像頭監控所在的位置,定義為Pi=(Id,lon,lat),Id為監測點Pi唯一標識,lon和lat為其所在經緯度。

定義2 路段。從一個監測點Pi到另一個監測點Pj之間的交通路線,可以理解為一個方向向量:Rk(Pi,Pj),路段的上游監測點為Pi,下游監測點為Pj。

定義3 旅行時間。T=(Cno1,Pi,t),表示車牌號為no1的車輛C正常情況下行駛通過路段Pi所花費的時間為t。

2.2 Storm下實現套牌甄別計算的挑戰

Storm自從Twitter開發出來主要用于解決其大量的實時統計類應用,正式開源后,其分布式實時計算性能非常高,容錯性良好,保證到達的每條消息都能得到處理,并且某些數據挖掘算法已經很好地在Storm系統中得到移植實現[15],快速準確地處理流數據,實時進行結果反饋。

盡管Storm已應用于智能交通上,但由于交通數據具有時空特性,解決的問題比較單一,例如用于處理黑名單車輛緝查和假牌車等這一類進行數據比較的問題。在套牌車的稽查時,根據套牌車的時空矛盾規則,其計算不僅需要實時數據還需要車牌歷史數據和業務數據,在Storm中缺乏對非實時數據合理有效組織的數據結構,僅支持對實時傳遞的數據的管理組織。在數據存儲方面,Storm只能在內存中短期存儲少量數據,無法長期存儲數據。如何在分布式環境下結合交通數據流的時空特性實時計算套牌車是當前一大挑戰。在接入數據源方面,Storm作業Topology的數據源Spout是直接從外部數據源源源不斷地讀取數據的,而交通數據流的數據源是城市道路上部署的各個高清攝像頭采集的車輛識別數據,攝像頭的數量有數千個,Spout無法直接和前端攝像頭建立連接并獲取車牌識別數據,因此需要接入消息中間件來承上啟下,將外部各個攝像頭采集的識別數據匯集成交通數據流以便Spout組件讀取數據流。

因此,本文研究的重點在于面對大規模實時交通數據流,應用分布式編程框架,結合車牌識別數據的時空特性和套牌車的時空矛盾規則,有效組織和管理非實時數據,準確高效地計算出路段上出現的套牌車。

3 面向套牌甄別的流式計算模型

本文在Storm環境下通過利用套牌車的時空特性進行計算,合理組織利用業務數據,對實時到達的車牌識別數據進行分析,根據當前車輛的地理位置(監測點),找出此車牌車輛過去一段時間內經過的所有監測點,結合基礎路段信息構建路段并計算出車輛經過這些路段的旅行時間,利用基礎路段閾值表中的路段閾值判斷車輛在所經過路段上是否出現了套牌。架構設計如圖1,數據的輸入分為兩類:經過消息中間件傳輸的實時數據流和數據庫中的基礎數據。流式數據是前端設備實時發送的車牌識別數據,通過消息中間件實現事件觸發,推送至系統。基礎數據是通過數據庫讀取接口讀取到處理系統的,為實現基礎數據更新后的業務連續性,每隔一段時間對加載的基礎數據進行定時更新,丟棄已有的基礎數據,重新讀取以保持數據的新鮮度。運行時環境用于維護數據結構和完成數據處理,包括對實時數據的接入、對具有時空特性的流式數據以滑動時間窗口形式進行維護,基礎數據在內存中的Hash結構、對流式數據的劃分策略、計算并行度的配置,以及監控和日志等基礎功能。數據的輸出主要是對計算的套牌嫌疑車直接進行實時布控以幫助交管部門進行執法以及將計算結果寫到數據庫用于長期存儲。

圖1 系統架構設計

3.1 混合數據

套牌車在交通數據流中的表現形式為正常行駛的車輛在短時間內不可能出現在相同的監測點或者不可能出現在不應該出現的兩個監測點,即車輛行駛過該路段的旅行時間小于該路段的套牌閾值,因此,參與計算的數據并不僅僅是前端攝像頭拍攝到的實時數據。參與計算的數據共分為以下三類。

實時數據 前端高清攝像頭產生的車輛識別數據,每秒會有2 000多條。系統對接收數據流中的每一條車牌識別數據都會進行實時計算。

業務數據 套牌閾值表,該表中存儲著城市道路的路段旅行時間,即此路段的套牌閾值。

歷史數據 歷史數據存儲的是當前接入的實時數據。歷史數據的存儲時間和大小是根據業務數據中最大的套牌閾值決定的,假設套牌閾值表中存儲的旅行時間閾值最大為1h,即從該路段的上游監測點出發行駛到下游監測點的最短時間為1h。假設當前到達的實時數據是某輛車在該路段的下游監測點被拍攝到的,判斷這輛車在該路段是否出現了套牌現象,則需要這輛車在該路段上游監測點被拍攝到的車輛識別數據,結合上下游監測點的時空屬性進行計算,因此,在歷史數據中應該存有這條車輛識別數據。所以歷史數據的時間長度不能小于業務數據中最大的套牌閾值。

3.2 數據組織

本文的目的是利用Storm計算框架實時計算出大規模交通流式數據中存在的套牌車嫌疑車,核心思想是進行實時并行計算,將計算任務分配到多個計算節點,最后對計算出的套牌嫌疑車進行布控。通過任務分配和對實時數據、業務數據及歷史數據這三類數據的有效組織管理達到提高計算性能、降低內存消耗的目的。

實時數據 組件Spout是Storm整個框架中的數據源,計算套牌車的數據源Spout組件以隊列連接的形式從實現JMS協議的消息中間件接收車牌識別數據。由于識別數據是一個由拍攝的照片、時間和車身顏色等22個屬性整合成的數據結構,蘊含信息比較龐雜,包括比如車身顏色等對套牌車計算無用的信息,稱這種類型的數據為冗余數據項,需要剔除冗余數據項以減少內存消耗,最后將識別數據中的識別車牌號、時間、地點等屬性封裝成一個Tuple元組。Spout通過追蹤每個元組樹來確保每一個元組被可靠地處理,成功處理則調用ack方法,失敗則調用fail方法,保證了數據處理的完整性。

歷史數據 本文所用業務數據中最大的套牌閾值為1h,因此需要維護歷史數據的時間長度為1h,將最近1h活躍的數據對象存儲在內存中。需要維護一種不但能夠對當前識別數據保存1h而且能在時間過后對數據進行刪除的數據結構。RotatingMap是Storm用來保存最近活躍對象和可以自動刪除已過期對象的數據結構,是由多個HashMap組成的一個LinkedList集合。本文借助RotatingMap這個數據結構作為基礎,進而構建滑動時間窗口,用于存儲歷史數據并刪除過期無效數據,數據存儲時間長度為1h,時間窗口更新頻率設定為10s(要小于套牌閾值表中最小的旅行時間閾值),則共有360(60min×60s/10s)個窗口,每個窗口都是一個HashMap,窗口每10s向前滑動一次,如圖2所示,時間長度始終保持為1h。

圖2 滑動時間窗口

業務數據 用兩個哈希表(HashMap)進行存儲,一個哈希表以路段上游監測點作為鍵值Key,Value為一個由以此鍵值Key作為上游監測點的所有路段的下游監測點組成的集合;另一個哈希表以路段下游監測點作為Key,Value為一個由以此鍵值作為下游監測點的所有路段的上游監測點組成的集合。

3.3 算法設計

拓撲邏輯如圖3所示,主要由三部分組成:數據源(spout)、套牌計算(T_bolt)和數據存儲(DB_bolt)。在作業Topology中,數據源Spout為作業從外部的數據源獲取車牌識別數據并剔除無效數據項(如攝像頭編號等),封裝成元組(Tuple),向計算組件不間斷地emit(發射)Tuple形成Stream。套牌計算是分布式并行計算,因此有多個計算組件Bolt獨立存在,它們的計算互不干擾,每個Bolt都會接收上游送達的Stream作為數據輸入,合理組織基礎數據和接收的數據,進而根據時空矛盾規則進行套牌車的計算,將計算出的套牌信息封裝成Tuple發射到下一個Bolt(命名為DB_bolt),作為DB_bolt的數據輸入。DB_bolt接收所有進行套牌計算組件的計算結果,把接收的數據存儲到數據庫中。

圖3 套牌計算Topology

作業Topology中Spout按Tuple中指定域的值——車牌號碼進行分組來進行數據劃分,向下游目標組件Bolt發送Tuple,即同一車牌的識別數據發送到同一個計算組件中。如圖4所示,這樣設計能夠確保具有相同車牌號的Tuple被發送到同一個Bolt,即同一個車牌號的識別數據會一直被確定Bolt處理而不會分散到其他Bolt上,保證了同一車牌號的計算中不會出現數據丟失現象。按車牌號劃分的這種數據劃分方式使計算水平擴展到多個節點,多個節點同時進行套牌車甄別,實現了分布式計算。

圖4 數據劃分

下游多個Bolt并行計算接收到的數據流中是否出現套牌車輛,并且將發現的套牌車輛信息都emit(發射)到同一個Bolt中,在該Bolt中將套牌嫌疑車的信息存儲到數據庫并對套牌嫌疑車進行布控。

套牌車計算的程序流程如圖5所示,由于Storm中的進程以服務的形式存在,除非人為主動停止或集群故障,這些進程將會一直運行,所以該流程只有開始標記而沒有結束標記。

第1步 對于來到的每一條數據獲取其監測點、車牌號以及時間戳,判斷路段基礎信息表中是否有此監測點:如果沒有則廢棄此條數據;如果有則進行下一步。

第2步 取出以此監測點作為路段上游監測點的所有路段及其路段閾值,以此監測點Id為Key,所有下游監測點組成的集合作為Value,組成HashMap;取出以此監測點作為路段下游監測點的所有路段及其路段閾值,以此監測點Id為Key,所有上游監測點組成的集合作為Value,組成HashMap。共有兩個哈希表。

第3步 找出當前車牌號行駛過的路段。循環遍歷以此監測點Id為上游監測點Key的HashMap的Value值,將當前識別數據的車牌和遍歷Value所得的一個下游監測點組合成鍵值Key,獲取時間窗口中緩存的信息,用來判斷是否有通過這個下游監測點的車輛(具有當前車牌號的車輛)。

第4步 計算當前車牌車輛所行駛過的路段的旅行時間,并判斷旅行時間是否小于套牌閾值,如果是則將此套牌嫌疑車信息封裝為Tuple傳遞給下一個Bolt。

第5步 將另一個HashMap中的數據按照第3步和第4步作同樣的處理。

第6步 將當前交通信息的車牌號和其監測點作為Key,時間戳作為Value存入時間窗口中。

第7步 將上一個Bolt的傳遞過來的套牌嫌疑車信息存入數據庫并對套牌嫌疑車加以布控。

圖5 程序流程

4 實驗

4.1 實驗環境

實驗是在6臺搭建了Storm環境的Linux虛擬機下進行的,Storm集群由1個Nimbus節點、5個Supervisor節點構成,配置均為4核CPU、8GB內存。ActiveMQ作為消息中間件,LoadRunner模擬攝像頭采集車輛數據,CCS(ConcurrentConnectionStream)[18]是一款用C++語言設計的,用于接收LoadRunner發送的車牌識別數據并轉發給ActiveMQ消息中間件,充當ActiveMQ和LoadRunner之間的通信服務器。

4.2 實驗數據

實驗中采用的數據是來自于某市2012-10-17到2013-01-04這80天420多個監測點產生的上百億條車牌識別數據,通過LoadRunner模擬成實時數據。

4.3 實驗用例

1)將LoadRunner并發數量分別設置為2 000,4 000,6 000,8 000,發送頻率為1條/s,用來模擬前端攝像頭數目分別為2 000,4 000,6 000和8 000,拍攝頻率為1條/s。集群計算組件Bolt的并行度設置為5,即計算并行度為5。啟動集群進行計算,集群正常工作后監控系統并記錄觀察一條識別數據從傳輸到計算完成所花費的平均時間。

如圖6所示:橫坐標為并發數量,縱坐標為時間(ms),可以看到處理時間在0.64ms~0.67ms波動,變化幅度很小,處理時間都近似于0.6ms,說明一條識別數據從傳輸到計算完成所花費時間是毫秒級的,驗證了本系統處理識別數據流的實時性,完全可以在大規模高并發的數據流下進行實時計算。通過圖6可以清晰看到,雖然LoadRunner并發度不一樣,即模擬攝像頭的數目有多有少,但一條識別數據的處理時間基本都一樣,這是因為本系統設計的滑動時間窗口長度固定為1h,計算所需歷史數據的時間長度不變,即使LoadRunner并發量增加,數據增多,但套牌車的甄別是根據其時空矛盾規則來計算的,即同一車牌號的車輛不可能在一定的時間閾值范圍內出現在兩個不同的地點,與數據量的多少沒有直接關系,因此,一條識別數據的處理時間基本一致。

圖6 不同數據量下的計算時間

2)為驗證系統高正確率,隨機抽取5d數據分別進行模擬實時計算和基于歷史車牌識別數據的并行計算[18]。基于歷史車牌識別數據的并行計算是在Hadoop平臺上對歷史車牌識別數據進行套牌車的并行檢測,是一種批量計算。根據計算結果,即計算出的套牌嫌疑車,與交通部門所提供套牌車對比并計算正確率。如圖7所示,分別計算出兩種方法的平均正確率,本系統的正確率為99%,高于批量計算98.3%的正確率。驗證了根據套牌車時空矛盾規則所設計的流式計算模型的高正確率。本系統的正確率之所以高,是因為采用的是基于路段閾值表的計算,路段閾值表中的路段閾值是在該城市道路中依照車輛正常行駛情況而得出的一個平均旅行時間作為該路段的套牌閾值,符合正常規律。而另一種批量計算是根據兩個監測點的經緯度,利用數學公式計算兩個監測點之間物理距離,然后根據車輛經過這兩個監測點的時間差,計算車輛的平均行駛速度VA,車輛最大速度閾值為VM,若VA>VM,即車輛已超出最大閾值,說明該車輛不可能在這個時間段內出現在這兩個地方,從而斷定此車輛的車牌在這兩個監測點出現了套牌。這種根據經緯度計算兩點之間的物理距離看似很合理,但是實際生活中,這兩個監測點之間的路段并不一定是一條直線,很有可能是一條彎曲或者傾斜的路,這就造成了誤差,降低了計算的正確率。因此,采用本文提出的方法計算出的套牌車的正確率更高。

圖7 實驗結果的正確率對比

3)對布控信息以可視化形式展示計算出的套牌嫌疑車信息:圖8中的監測點1和監測點2表示此車輛的車牌在這兩個監測點出現了套牌,交通部門的管理人員可通過此布控信息偵查套牌車。

5 結語

針對當前套牌車泛濫以至影響正常交通秩序的現狀,提出了一種基于車牌識別數據的流式計算套牌車主動識別的方法。提出了針對套牌車主動識別的基于路段閾值表的計算模型,結合套牌車的時空特性創建時間滑動窗口以處理交通歷史數據,對參加計算的混合數據進行了合理有效組織并加以實時計算;對結果數據——套牌嫌疑車及時有效地進行布控并加以存儲,從而實時地發現套牌車。面對城市道路連續不斷實時產生的數據流,能夠將數據流在線接入并進行實時計算。在Storm環境下,實驗結果驗證了本文方法的準確性和實時性,能夠幫助交通管理部門實現對違法套牌車的實時布控和現場處罰,滿足交通管理部門的需要。

圖8 本文算法結果展示

在下一步的研究工作中,將進一步地探索和研究基于交通數據流的套牌車實時甄別。本文所設計的計算模型雖然相對于現有方法,其計算套牌車的準確性和實時性有較大幅度提升,但是由于基礎路段閾值表較大,在存儲方式上仍有不足,導致計算性能沒有達到最優。因此在下一步的研究中將繼續對基礎路段閾值表的加載、存儲和查詢進行研究,降低內存使用率,提高對閾值表的查詢速度,提升計算性能。

)

[1] 黃銀龍,王占斌,徐旭,等.基于ISO/IEC18000—6B標準的RFID車卡防偽問題研究[J].射頻世界,2008(5):39-42.(HUANGYL,WANGZB,XUX,etal.Researchonanti-counterfeitingproblemofRFIDvehicletagsbasedonthestandardofISO/IEC18000—6B[J].RadioFrequencyIdentification, 2008(5): 39-42.)

[2] 孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,50(1):146-169.(MENGXF,CIX.Bigdatamanagement:concepts[J].JournalofComputerResearchandDevelopment, 2013, 50(1): 146-169.)

[3] 覃雄派,王會舉,杜小勇,等.大數據分析——RDBMS與MapReduce的競爭與共生[J].軟件學報,2012,23(1):32-45.(QINXP,WANGHJ,DUXY,etal.Bigdataanalysis——CompetitionandsymbiosisofRDBMSandMapReduce[J].JournalofSoftware, 2012, 23(1): 32-45.)

[4] 孫大為,張廣艷,鄭緯民.大數據流式計算:關鍵技術及系統實例[J].軟件學報,2014,25(4):839-862.(SUNDW,ZHANGGY,ZHENGWM.Bigdatastreamcomputing:technologiesandinstances[J].JournalofSoftware, 2014, 25(4): 839-862.)

[5] 劉學靜,李崇,郝飛,等.含光學隱碼的汽車牌照防套牌技術研究[J].大連理工大學學報,2011,51(z1):77-80.(LIUXJ,LIC,HAOF,etal.Researchonanti-fakevehiclelicensetechnologywithopticalimplicitcode[J].JournalofDalianUniversityofTechnology, 2011, 51(z1): 77-80.)

[6]IQBALU,ZAMIRSW,SHAHIDMH,etal.Imagebasedvehicletypeidentification[C]//Proceedingsofthe2010InternationalConferenceonInformationandEmergingTechnologies.Piscataway,NJ:IEEE, 2010: 1-5.

[7]CHENC,LIUZ,LINWH,etal.DistributedmodelinginaMapReduceframeworkfordata-driventrafficflowforecasting[J].IEEETransactionsonIntelligentTransportationSystems, 2013, 14(1): 22-33.

[8] 李悅,劉晨.基于歷史車牌識別數據的套牌車并行檢測方法[J].計算機應用,2016,36(3):864-870.(LIY,LIUC.Paralleldiscoveryoffakeplatesbasedonhistoricalautomaticnumberplaterecognitiondata[J].JournalofComputerApplications, 2016,36(3): 864-870.)

[9] 俞東進,平利強,李萬清,等.一種基于Hadoop的套牌車識別方法:CN201410100491.7[P].2014-03-18.(YUDJ,PINGLQ,LIWQ,etal.Hadoop-basedrecognitionmethodforfake-licensedcar:CN201410100491.7 [P].2014-03-18.)

[10]DEANJ,GHEMAWATS.MapReduce:simplifieddataprocessingonlargeclusters[J].CommunicationsoftheACM, 2008, 51(1): 107-113.

[11]ZAHARIAM,DAST,LIH,etal.Discretizedstreams:anefficientandfault-tolerantmodelforstreamprocessingonlargeclusters[C]//HotCloud’12:Proceedingsofthe4thUSENIXConferenceonHotTopicsinCloudComputing.Berkeley,CA:USENIXAssociation, 2012: 10-10.

[12]NEUMEYERL,ROBBINSB,NAIRA,etal.S4:distributedstreamcomputingplatform[C]//ICDMW2010:Proceedingsofthe2010IEEEInternationalConferenceonDataMiningWorkshops.Piscataway,NJ:IEEE, 2010: 170-177.

[13]STOESSJ,STEINBERGU,UHLIGV,etal.AlightweightvirtualmachinemonitorforBlueGene/P[J].InternationalJournalofHighPerformanceComputingApplications, 2012, 26(2): 95-109.

[14] 鄭緯民.從系統角度審視大數據計算[J].大數據,2015(1):17-26.(ZHENGWM.Gazeatthecalculationofbigdatafromasystematicpointofview[J].BigData, 2015, 1(1): 17-26.)

[15]LEIBIUSKYJ,EISBRUCHG,SIMONASSID.GettingStartedwithStorm[M].Sebastopol:O’ReillyMedia, 2012: 4-20.

[16]ANDERSONQ.StormReal-TimeProcessingCookbook[M].Birmingham,UK:PacktPublishing, 2013: 4-8.

[17]DINGW,HANY,ZHAOZ,etal.Stream-orientedavailabilityservicesforendpoint-to-endpointdatatransmission[C]//Proceedingsofthe2012InternationalConferenceonCloudandServiceComputing.Washington,DC:IEEEComputerSociety, 2012: 212-218.

ThisworkispartiallysupportedbytheBeijingMunicipalNaturalScienceFoundation(4162021),theR&DGeneralProgramofBeijingEducationCommission(KM2015_10009007),theKeyYoungScholarsFoundationfortheExcellentTalentsofBeijing(2014000020124G011).

QIAO Tong, born in 1991, M.S.candidate.His research interests include real-time data processing, intelligent transportation.

ZHAO Zhuofeng, born in 1977, Ph.D., associate professor.His research interests include cloud computing, mass data processing, intelligent transportation.

DING Weilong, born in 1983, Ph.D., lecturer.His research interests include real-time data processing, distributed system.

Stream computing system for monitoring copy plate vehicles

QIAO Tong1,2*, ZHAO Zhuofeng1,2, DING Weilong1,2

(1.InstituteofDataEngineering,NorthChinaUniversityofTechnology,Beijing100144,China;2.BeijingKeyLaboratoryonIntegrationandAnalysisofLarge-scaleStreamData(NorthChinaUniversityofTechnology),Beijing100144,China)

The screening of the copy plate vehicles has timeliness, and the existing detection approaches for copy plate vehicles have slow response and low efficiency.In order to improve the real-time response ability, a new parallel detection approach, called stream computing, based on real-time Automatic Number Plate Recognition (ANPR) data stream, was proposed.To deal with the traffic information of the road on time, and plate vehicles could be timely feedback and controlled, a stream calculation model was implemented by using the threshold table of road travel time and the time sliding window, which could access real-time traffic data stream to calculate copy plate vehicles.On the platform of Storm, this system was designed and implemented.The calculation model was verified on a real-time data stream which was simulated by the real ANPR dataset of a city.The experimental results prove that a piece of license plate recognition data can be dealt with in milliseconds from the time of arrival to the calculation completion, also, the calculation accuracy is 98.7%.Finally, a display system for copy vehicles was developed based on this calculation model, which can show the copy plate vehicles from the road network on the current moment.

copy plate vehicle; Automatic Number Plate Recognition (ANPR); stream computing; real-time; threshold table; Storm

2016-07-25;

2016-08-08。 基金項目:北京市自然科學基金資助項目(4162021),北京市教育委員會科技計劃面上項目(KM2015_10009007);北京市優秀人才培養資助青年骨干個人項目(2014000020124G011)。

喬通(1991—),男,山東泰安人,碩士研究生,主要研究方向:實時數據處理、智能交通; 趙卓峰(1977—),男,山東濟南人,副研究員,博士,CCF高級會員,主要研究方向:云計算、海量數據處理、智能交通; 丁維龍(1983—),男,山東泰安人,講師,博士,CCF會員,主要研究方向:實時數據處理、分布式系統。

1001-9081(2017)01-0153-06

10.11772/j.issn.1001-9081.2017.01.0153

TP274

A

主站蜘蛛池模板: 波多野结衣视频网站| 亚洲一区二区三区在线视频| 久久国产精品国产自线拍| 亚洲成aⅴ人片在线影院八| 国产精品久久久久久搜索| 日韩中文字幕免费在线观看| 日韩无码视频播放| a毛片基地免费大全| 国精品91人妻无码一区二区三区| 成人一区在线| 欧美亚洲激情| 亚洲国产高清精品线久久| 国国产a国产片免费麻豆| 91无码国产视频| 精品乱码久久久久久久| 国产精品太粉嫩高中在线观看| 五月天福利视频| 亚洲综合九九| 国产真实二区一区在线亚洲| 99精品视频播放| 国产情侣一区| 青青草原国产免费av观看| 中美日韩在线网免费毛片视频| 毛片在线播放a| 亚洲天堂久久久| 日韩小视频在线播放| 久久国产精品影院| 欧美a级完整在线观看| 国产成人精品无码一区二| 国产小视频在线高清播放| 国产网站免费看| 亚洲国产精品日韩专区AV| 国产成人凹凸视频在线| 成人午夜亚洲影视在线观看| 一级毛片视频免费| 高清国产在线| 免费人成在线观看视频色| 亚洲精品午夜无码电影网| 日韩无码黄色网站| 国产成人精彩在线视频50| 欧美成a人片在线观看| 午夜电影在线观看国产1区| 欧美亚洲国产精品第一页| 91精品视频在线播放| 欧美在线精品怡红院| 久久精品人人做人人爽电影蜜月| 欧美亚洲另类在线观看| 国产成人午夜福利免费无码r| 国产女同自拍视频| 国产视频久久久久| 国产白浆在线| 尤物成AV人片在线观看| 久久国产精品77777| 亚洲日本中文字幕天堂网| 制服丝袜无码每日更新| 日韩国产综合精选| 国产流白浆视频| 东京热av无码电影一区二区| 精品无码国产自产野外拍在线| 国产精品流白浆在线观看| 欧美中文字幕无线码视频| 国产黄色爱视频| 亚洲欧美日韩另类在线一| 91美女视频在线| 丝袜美女被出水视频一区| 最新日本中文字幕| 日韩区欧美国产区在线观看| 国产日韩欧美黄色片免费观看| 亚洲国产午夜精华无码福利| 手机成人午夜在线视频| 国产91在线|中文| 亚洲区一区| 99久久精品免费视频| 亚洲一区二区三区在线视频| 国产男人的天堂| 永久免费无码成人网站| 亚洲精品午夜天堂网页| 日韩精品免费在线视频| 伊人91在线| 欧美另类视频一区二区三区| 欧美区一区| 欧美日韩在线第一页|