葉海燕
(巢湖學院信息工程學院,安徽 巢湖 238024)
物聯網在許多領域為人類生活提供便利,包括醫療保健、自動化、交通以及對人為和自然災害的應急響應[1]。它可以通過整合嵌入式設備、通信技術、傳感器網絡、互聯網協議徹底改變人類生活[2]。大多數國家已經確定了實施物聯網的長期國家戰略。例如,日本的寬帶接入促進了人與物之間、物與物之間的通信[3]。到2050 年,世界70%的人口將居住在城市及城郊。面對如此龐大的人口數量,數十億臺設備的相互通信,將產生壓倒性的大數據。因此,在根據用戶需求和選擇分析數據時,城市將變得更加智能[4]。無線傳感器網絡(WSN)及其相關技術完美地統一到城市基礎設施中,嵌入式設備的普及產生的大量信息將在各種平臺和應用程序之間共享,通過對大數據進行分析可以預測規劃城市的發展[5]。本研究提出了一個4 層架構來開發智慧交通城市并使用基于物聯網的大數據分析進行城市規劃。該架構能夠分析從城市智能系統的各種來源生成的大量物聯網數據集,并使用所提出的系統做出決策。
在實際項目案例中,大數據算法中應用最廣的是線性回歸分析,與非線性回歸模型相比,線性回歸的未知參數更容易擬合,其估計結果也更容易統計,它的主要原理如下所示。
線性回歸模型hθ(x)和自變量X、觀測標簽數據Y,在數據集D里,假設hθ(x)與X之間具有線性關系,并對兩者之間關系進行建模如下:
線性理論的主要應用場景一是不同類別的判斷;二是多種冗余數據的辨別,其預測的功能是因變量hθ,與自變量X進行擬合,然后通過自變量X來預測因變量hθ,對于冗余數據的判斷在于,線性模型分析變量之間的關系強度,哪些自變量和因變量的關系較弱,然后將這些弱變量進行剔除。求解目標為已知一些數據的特征和標簽,計算其中的參數θ,將數據的擬合誤差減小到最小,其采用最小平方差進行表示,m為數據中的條目,目標函數如下:
采用最小二乘法求解該目標函數:
在實際的應用案例中,線性回歸容易擬合的優點一直得到廣泛的應用,如廣義的線性模型,多項回歸和層次線性模型。
根據現有智能交通系統物理框架,結合大數據,參照物聯網已有體系結構進行系統構建,圖1為構建的基于物聯網大數據的城市智能交通系統物理框架。

圖1 基于物聯網大數據的城市智能交通系統物理框架
基于物聯網大數據的城市智能交通系統物理框架分為終端層、物聯網平臺層、智能應用層3 層。其特點包括:終端層由交通系統用戶主體構成;物聯網平臺層分為前端信息采集、處理及網絡傳輸兩階段;物聯網平臺層有支撐平臺,包括各類中間件、基礎資源平臺、CTI(Computer Telecommunication Integration)平臺、通信服務平臺;基礎資源平臺包含基礎信息數據庫、空間地理數據庫、業務數據庫;智能應用層包含智能交通系統各子系統,通過分析處理感知數據,為智能交通用戶提供服務。各子系統依靠物聯網提供的數據進行傳遞、遠程服務功能;根據終端數據特點進行處理、決策,實現終端控制。
2.2.1 數據的采集融合處理功能
數據融合屬于一種信息處理過程,是按照一定規則將多種數據分析、決策、綜合、評估的過程[6]。因交通信息數據量大、數據種類豐富,數據融合使交通信息加工、處理相對容易,決策能力提高。交通監測系統與信息采集系統負責交通狀態數據的采集,包括占有率、車速、交通量等,由傳感器采集地理信息數據后錄入,在經物聯網平臺的處理融合后,這些原始數據構成交通狀態基礎數據。
2.2.2 共享數據的組織管理和數據挖掘功能
因智能交通系統各子系統對數據要求存在差異,且數據量龐大,因此需建立數據庫進行數據分類、統計、備份等。交通規劃支持系統需歷史數據支持,交通誘導系統需實時數據支持。當需要從多個數據庫進行數據調用時,須進行數據庫合理組織和管理,比如物聯網需要數據倉庫和數據挖掘技術,實現對各種海量數據的分析、組織和管理,實現高層次分析、決策。隨著時間累積,交通基礎信息原始數據日漸增多,這些數據滿足交通管理、單純交通誘導及控制子系統,可從大量交通數據中進行有價值的、潛在的信息提取,從而得到某一方面交通發展規律,為智能交通系統更好地服務。
2.2.3 提供信息服務并實現數據共享功能
智能交通系統功能是在城市交通物聯網平臺大量數據基礎上實現的。城市交通物聯網平臺須滿足智能交通系統各子系統對數據的要求,提供各種功能服務,數據共享基于提供的數據服務通道得到實現。為向智能交通系統各層次用戶主體提供信息服務、輔助決策,提出決策性問題解決方案。
圖2為物聯網平臺下交通管理與規劃子系統邏輯數據流圖,其中虛線箭頭為新增的數據流,在邏輯框架中,新增用戶服務通過這些數據流體現。

圖2 物聯網平臺下交通管理與規劃子系統邏輯數據流圖

圖3 實施模型
通過與外部子系統信息交換,該子系統對道路交通進行管理。交通管理分為城市間、城市內交通管理。通過交通可變情報板、外子系統等信息交換途徑,給緊急事件管理子系統、第三方消息提供者、出行者等提供事件信息。與相鄰道路交通管理系統進行信息交換,協調相鄰地區交通控制策略,從而提高道路通行能力。對于整個智能交通系統體系結構而言,系統可為其提供數據分析、存檔功能。從其他中心子系統進行當前數據、歷史數據、預測交通信息的收集,用來對當前交通系統性能進行分析、評價,并對將來的運輸系統進行規劃和改進。在電子收費區域內,能對駕駛車輛超速、其他違規事件進行檢測,并識別、檢測及進行圖像捕捉。系統實時監控各種交通行為,進行違規事件檢測、確認、處罰,并對違規車輛、違規駕駛行為及時通告。
為了解系統的重要性,并對系統進行可行性研究。對各種物聯網數據集進行詳細分析,通過說明系統如何使用相同的物聯網生成用于實時決策的數據[9],并對歷史數據進行在線分析來進行城市規劃,從而使城市更智能。
通過從各種可靠的資源中獲取大型物聯網生成的數據集。數據集包括:車輛數據集,停車位數據集,包括停車區車輛數量;污染數據集,例如各種氣體和噪聲污染;社交媒體數據集;天氣數據集,包括室內外連續測量溫度、濕度、降雨等[7]。本文調研了國內某地區車輛移動性數據集,停車場數據集涵蓋了8個停車場的使用情況的連續監測。污染數據集和車輛數據集是通過將傳感器同時放置在同一位置以發現交通對環境的影響而生成的。通過將出發地和目的地的傳感器放置在不同位置,估計兩點之間的交通,其中包含有關兩點間車輛平均速度、平均速度和到達第二點的時間的各種信息并生成車輛數據[8]。
智慧城市發展的主要挑戰是分析實時數據并采取緊急行動[9]。它可以幫助公民選擇高效路線等方式節省燃料,減輕城市的環境污染。在圖4中,分析不同道路上的交通強度,通過車輛和車速之間的關系,系統可以設計道路以更好地管理車輛。通過折線圖可知,當車輛數量較多時,車速會降低。因此,圖4 中的統計數據可用于在規劃未來時設計車輛強度高的寬路。

圖4 兩點之間交通強度高時車輛的速度
在圖5 中,通過測試不同持續時間下道路上車輛的強度。例如,從圖表中看到08:25 和11:55 的車輛的數量非常多。因此,設計一個高效的道路系統,可以在高峰時段動態改變路線。還可將傳感器安裝在不同位置,當發生事故和擁堵時與車輛進行通信。

圖5 一天中不同時間出發地和目的地之間的車輛數量
從上述基于物聯網的網絡流量分析,可以預測從一點到達另一個點的時間。智慧城市可以實時分析車輛交通數據,并根據當前交通強度選擇最優路線,從而減少到達目的地所需的時間。當交通強度變高或道路因事故等原因阻塞時,智慧城市的交通管理不僅可以幫助人們節省燃料,還可以確保安全,避免單點產生大量的交通污染[10]。
對物聯網的救援方案出現的問題,物聯網下子系統救援方案可對其進行很好地解決[11]。在救援方案中,物聯網下子系統使用用戶服務包括提供多方式進行所需規劃的信息,及時準確處理規劃信息,最優策略通過協作產生,交通信號自適應控制,協調與控制路網流量,提前預防各類事件、主動檢測響應各類事件等。在事件救援、預防、路徑誘導等方面,救援方案具有一定的優勢。
圖6 為交通信息采集模塊圖,物聯網下的子系統信息采集功能比較完善。在交通信息采集模塊中,底層城市交通系統涉及地感線圈、紅外、視頻等傳感系統,時刻感知外界交通環境變化;中間層為數據采集網關、中間件、通信服務平臺、數據庫,負責服務代理、數據提供,是傳感系統采集數據被上層應用系統利用的橋梁;最上層是規劃子系統、交通管理的部分,可利用平臺提供數據完成一定的功能。物聯網下的道路兩側有多種信息采集設備,包括紅外感應、RFID閱讀器,還有檢測路面、天氣狀況等的傳感器。在交通管理中心,通過傳感設備收集路況信息,這些信息經數據分析,可對該路段發送相關提示信息,從而使該路段駕駛員提高警惕,采取相應措施,降低事故發生概率。

圖6 交通信息采集模塊圖
物聯網下的路口或路段還包括紅外、雷達、GPS、RFID 等傳感器,主要進行感知路段和路網內交通量、車速、擁堵狀況等交通信息的收集。交通管理中心通過分析這些數據,對已發交通事故進行判定,并向交通指揮中心報警。多方位檢測事故地點附近視頻檢測設備,以供指揮中心對事故地點、類型、傷亡程度等信息進行確認。GPS 定位系統可給相關部門傳送車輛精確位置信息。車輛自身帶有傳感器,在有碰撞發生時,車輛會向路邊信息進行節點采集,并進行報警信號的發送,由信息采集節點給指揮中心發送。
在事故確定后,須出動救護車、警車等緊急車輛,指揮中心須做出聯動處理方案。如給緊急車輛發送事故相關信息,為緊急車輛選擇多條或一條能到達事故地點最優路徑,對事故周邊路網、發生路段實施車輛誘導等。
通過對各路段車速、交通量、擁堵情況等交通信息分析,指揮中心迅速得出緊急車輛通過該路徑的時間,可對最優路徑進行確定。信息采集設備分析、加工、融合采集的大量數據后,進行數據庫分類管理,這些信息是交通狀態基礎數據。物聯網平臺利用數據挖掘技術、數據倉庫,可提取大量有價值的、潛在的交通信息,得到交通事故發生的該路段路網交通量、車速等變化規律,為最優路徑選擇提供準確參考。
圖7 為最優路徑選擇,救護車從C 處到事故地點A 處,有多條路徑,如C-1-6-8-9-10-A 和C-1-4-5-7-10-A 等路徑。救護車發出出動命令后,指揮中心選擇最優路徑,根據路徑上信息采集設備得到每一條路徑擁堵情況,并計算出救護車通過此路徑的時間,從而將由C-A的最優路徑判定出來。

圖7 最優路徑選擇
基于收集到的數據集,該系統是使用Hadoop單節點和開發的3.2GHz×4 個處理器和4GB 內存以及Hadoop-pcap-lib 和Hadoop-pcap-scr-de 庫處理。這些流量數據然后被轉換成序列文件,以便能夠使用Hadoop 處理它們。城市規劃系統的實施分為物理、中層和上層3 個層次,物理層稱為存儲層,基于Hadoop HTFS 系統。所有歷史數據都存儲在物理層,每個數據集在圖中都有一個編號。中間層是第二層,也稱為加工層,所有處理都在此級別使用存儲在物理級別上的數據執行,在這個層次上,進行統計、計算、圖形分析和其他計算。第三級是上層,也稱為決策層,關于城市規劃的決定是在這個層面上做出的。決策層為每種類型的規劃提供各種模塊,例如道路規劃和建筑規劃。
所提出的算法是在具有3.2GHz 處理器和4GB內存的UBUNTU機器上使用Hadoop單節點設置實現的。對于實時流量,使用Wireshark 庫生成Pcap數據包,并使用其他系統重新傳輸它們以開發我們的系統。Hadoop-pcap-lib、Hadoop-pcap-serde和Hadoop Pcap 輸入庫用于網絡數據包處理和在收集聚合單元生成Hadoop 可讀,以便Spark 可以處理數據。因為該系統基于大數據分析,它是根據效率和響應時間進行評估的。考慮到處理時間(以毫秒為單位)和吞吐量(Mbps),針對各種大小的數據集測量系統性能。處理時間結果如圖8所示。從圖中可以明顯看出,當數據量增加時,處理時間也成比例增加,因為數據量和處理時間成正比。但是,檢查在更高更大數據集上的處理,即5345MB;這個數據集的處理時間是300000毫秒,遠遠優于其他系統。

圖8 各種規模的車輛數據集的處理時間
智慧交通城市能方便市民出行,也可以幫助政府作出科學有效的交通決策。本文通過使用物聯網生成的大數據分析提出了一個智能交通城市規劃系統。
1.設計交通管理與規劃子系統,新增用戶服務領域,確定新增的子服務與數據流對應關系,對子系統整體進行功能描述,設計得到物聯網下子系統。
2.通過分析基于物聯網的智慧城市數據集,包括車載網絡、智能停車、天氣、污染、監控等,可以開發智慧城市并作出城市規劃決策。
3.對子系統進行技術實例分析。假設某市區發生一起交通事故,從交通事件提前預防、檢測、報警方式、聯動處理、路徑誘導、交通量調節等方面分析了基于物聯網救援方案的過程。根據路徑上信息采集設備得到每一條路徑擁堵情況,并計算出救護車通過此路徑的時間。