仵 博,馮延蓬,孟憲軍,江建舉,何國坤
(深圳職業技術學院 教育技術與信息中心,廣東 深圳 518055)
在安防領域,信息孤島問題突出.在一座城市,有公安部門安裝的攝像監控設備,也有各個單位安裝的攝像監控設備.這些設備或系統產生的監控數據難于實現互聯互通,造成信息孤島現象,“只見樹木,不見森林”.近年來,以云計算和物聯網為核心的智慧城市建設提出大安防概念[1],試圖將這些孤立的視頻信息集成在一起,從而實現聯網和共享.然而,視頻信息數據量巨大,造成通信帶寬的巨大消耗.
在安防視頻監控領域,隨著高清監控時代的到來,產生了越來越多的海量視頻數據,是一種典型的大數據.如何以較小的通信代價實現安防大數據的互聯互通,并具有較高的擴展彈性和易于實施的特點,是目前安防大數據的挑戰難題.針對這一挑戰難題,本文提出一種基于大數據的分布式云計算模型.
安防大數據具有2個明顯的特點:1)數據規模海量化;2)數據類型非結構化.數據規模海量化造成數據傳輸和存儲的困難,數據類型非結構化為數據利用帶來了極大的挑戰,為了解決這些難題需要大數據.IDC將大數據視為一個融合的體系:具備大規模的體量(Volumes)、多樣化的種類(Variety)的數據集以及對這種數據集進行高速(Velocity)采集、處理與分析以提取價值(Value)的技術架構與技術過程[2].
Hadoop技術正是在此背景下誕生,歷經數年的積累,Hadoop已成長為一個強大的生態系統,成為IT領域廣泛采用的大數據模型框架.Hadoop主要由分布式文件系統(HDFS)、并行計算架構(MapReduce)和分布式數據庫(HBase)組成.其中,HDFS是針對大規模數據的高容錯性和高吞吐的分布式文件系統,它可以構建從幾臺到幾千臺由常規服務器組成的集群中,并提供高聚合輸入輸出的文件讀寫訪問.HBase是一個分布式的、按列存儲的、多維表結構的實時分布式數據庫,它可以提供大數據量架構化和非結構化數據高速讀寫操作,為高速在線數據服務而設計.MapReduce適用于大數據量處理的分布式框架,是為離線數據分析而設計,利用數據的并行性進行分布運算,而后匯總結果的計算框架[3].
大數據已在安防領域初步取得成功的應用,例如紐約市警察局與微軟合作推出了基于大數據的犯罪預防與反恐技術:領域感知系統(Domain Awareness System,簡稱DAS).該系統能快速混合與分析從約三千臺閉路攝像機、9·11呼叫記錄、車牌識別器、輻射傳感器以及歷史犯罪記錄中獲取的實時數據.目前紐約市警察局已能追蹤機動車,并確定此車在過去幾天甚至幾個星期的所到之處;還能快速訪問犯罪嫌疑人的逮捕記錄以及所有特定案件的9·11呼叫記錄,將犯罪記錄以時間先后順序按地理空間技術映射出來,以揭示犯罪模式[3].
雖然大數據在 DAS中得到成功應用,但是DAS的范圍還很有限.首先,存在信息孤島現象,各個單位和小區獨立的攝像系統還有充分利用,造成感知出現死角.其次,集中式的計算和存儲造成通信成本高、難于管理.為此,本文提出一種基于大數據的分布式云計算模型,其示意模型如圖1所示.
在基于大數據的分布式云計算模型中,域結點是一個全局結點,負責任務的派發和信息的整合.子域結點為局部結點,負責從域結點接收任務.終端結點即為具體的攝像頭,負責實時傳送信息.以某城市為例,假如該城市欲將某高校納入其安防大數據范圍,而該高校又有三個校區.則域結點為該城市安防大數據的控制中心,第一層子域結點為該高校的主控中心,該高校三個校區的控制中心都為第二層子域結點,每個校區的監控設備為終端結點.基于大數據的分布式云計算模型具有以下優勢:
1)擴展彈性高.域結點與子域結點之間只需光纖連接起來,就可以實現對監控范圍擴展.
2)通信帶寬低.由于子域結點具有自己的計算和存儲能力,根據域結點的任務指令,子域結點只需將計算后的視頻信息片段發送到域結點,從而降低通信帶寬.
3)易于實施.域結點與子域結點連接后,只需在子域結點處安裝相應的軟件系統,即可實現互聯互通,子域結點的現有系統結構無需改變,避免重復建設,節省建設成本.

圖1 基于大數據的分布式云計算模型
域(子域)結點的系統架構采用Hadoop技術[5],由安防信息決策系統、分布式數據處理系統(MapReduce)、海量數據分布式存儲系統和分布式數據處理結點組成,如圖2所示.域(子域)結點系統的功能主要包括[6]:
1)統一指揮布控.對接入系統分布式網絡的視頻數據監控節點分層次集中統一管理.每個管理子節點都能夠有效監控其管轄下的所有監控視頻以進行分析處理預警,并能夠將相關處理后的特征信息反饋到上一級節點進行匯總,避免監控數據孤島現象.同時也能接受主節點下發的監控指令,對視頻內容進行在線處理,以識別出指令特征所描述的人物及場景進行預警并上報.
2)物體追蹤.根據物體的運動情況,自動發送相應控制指令,控制攝像頭自動跟蹤物體.如果物體超出該攝像機監控范圍,能自動通知物體所在區域其它攝像頭繼續進行追蹤.
3)人的面相、步態等識別.自動對人臉和人的步態特征進行識別,可以用來幫助識別和驗證是否為指定人物的身份.
4)車輛識別.識別車輛的形狀、顏色、車牌號碼等特征,可用于監控指定車輛的追蹤.

圖2 基于云計算的大數據安防監控系統架構
5)非法滯留的判別.對人或物體在敏感區域停留的時間超過了預定義的時間長度時產生報警.
6)治安事件的監測.指定范圍內人的行為特征是否符合某一個性行為模式,用以實時監控預警治安事件.
本文為解決安防領域中的信息孤島問題,提出一種分布式云計算模型,該模型具有擴展彈性高、通信帶寬低和易于實施等特點.應用是大數據的生命和價值所在,解決信息孤島問題是大數據應用的前提.在安防大數據領域,有眾多應用可以開發,例如犯罪嫌疑人跟蹤、犯罪和群體事件預防、老人小孩失蹤尋找、車輛跟蹤以及交通堵塞疏導等等.這些應用都與人們日常生活和安全密切相關,安防大數據為解決這些問題提供了一種有效手段.但是,安防大數據的基礎應用理論尚需進一步的創新研究,特別是需在模式識別[7,8]、數據挖掘[9-11]、機器學習[12-15]和智能決策[15-18]等關鍵技術瓶頸上取得突破.只有這些根本性的問題得到解決,安防大數據才能真正得到應用.
[1] 楊金才.物聯網成就大安防[J].中國公共安全(綜合版),2012,3:30-31.
[2] 周林.中國互聯網市場洞見:互聯網大數據技術創新研究[EB/OL].(2012-05-24)[2013-10-11].http://www.idc.com/getdoc.jsp?containerId=CH1749312 U.
[3] 成靜靜.基于Hadoop的分布式云計算/云存儲方案的研究與設計[J].數據通信,2005,5:14-18.
[4] 鐘鑫,逯永超.國外警方研究利用“大數據”預防打擊犯罪[EB/OL].(2013-04-09)[2013-10-11].http://211.103.209.164/news/show.aspx?showid=4248.
[5] Durut M. Clustering Algorithms distributed over a Cloud Computing Platform[D].Paris : TELECOM ParisTech, 2012:83-117.
[6] 建新.智能視頻監控技術的演變對比及主要優勢[J].金卡工程,2006,4:69-71.
[7] Lee D D, Seung H S. Learning the parts of objects by non-negative matrix factorization[J].Nature, 1999,401:788-791.
[8] Tenenbaum J B, Silva V D, Langford J C. A global geometric framework for nonlinear dimensionality reduction[J].Science, 2000,290(5500):2319-2323.
[9] 孟憲軍.互聯網文本聚類與檢索技術研究[D].哈爾濱: 哈爾濱工業大學,2009:80-120.
[10] Evans J A, Foster J G. Metaknowledge[J].Science,2011,331(6018):721-725.
[11] Frey B J, Dueck D. Clustering by passing messages between data points[J].Science, 2007,315(5814):972-976.
[12] Frommberger L, Wolter D. Structural knowledge transfer by spatial abstraction for reinforcement learning agents[J].Adaptive Behavior, 2010,18(6):531-539.
[13] Subramanian K, Isbell C, Thomaz A. Learning options through human interaction[C]//Beal J, Knox W B.Proceedings of 2011 IJCAI Workshop on Agents Learning Interactively from Human Teachers. Palo Alto:AAAI Press, 2011:39-45.
[14] 仵博.動態不確定環境下的智能體序貫決策方法及應用研究[D].長沙:中南大學,2013:60-75.
[15] Bishop C M. Pattern recognition and machine learning[M].New York:Springer, 2006:55-60.
[16] 馮延蓬,仵博,鄭紅燕,孟憲軍.WSN中一種目標追蹤在線節點調度算法[J].計算機工程,2012,38(11):96-99.
[17] Wu F, Zilberstein S, Chen X P. Online planning for multi-agent systems with bounded communication[J].Artificial Intelligence, 2011,175(2):441-790.
[18] 仵博,吳敏,佘錦華.基于點的POMDPs在線值迭代算法[J].軟件學報,2013,24(1):25-36.