傳感器抓取各式各樣的數(shù)據(jù),這些信息哪些有用?哪些是垃圾?哪些需要歸檔?哪些僅僅是需要短暫保留的中間信息?物聯(lián)網(wǎng)應該具備基本的分辨能力。
物聯(lián)網(wǎng)的第一階段是完善信息獲取途徑,通過各式各樣的傳感器抓取信息;隨之而來的,就是如何處理急速膨脹的數(shù)據(jù)。這些信息哪些有用?哪些是垃圾?哪些需要歸檔?哪些僅僅是需要短暫保留的中間信息?物聯(lián)網(wǎng)應該具備基本的分辨能力。
在日前舉行的“第八屆全球電子峰會”(Electronics Summit 2010)上,IBM Fellow(院士)、系統(tǒng)與科技事業(yè)部戰(zhàn)略聯(lián)盟副總裁及首席技術官Bernard S. Meyerson強調(diào),建設物聯(lián)網(wǎng),現(xiàn)在就應該關注如何處理紛繁復雜的數(shù)據(jù),否則,當傳感器網(wǎng)絡越來越完善時,隨之而來的數(shù)據(jù)爆炸將讓企業(yè)淹沒在信息洪流中,無法自拔。
“物聯(lián)網(wǎng)讓物與物之間對話,但首先要研究傳感器如何與IT更好地對話。” Meyerson認為,終端設備采集來的數(shù)據(jù)進入IT系統(tǒng)之前,就應該被智能地處理。IBM研發(fā)的流計算(Stream Computing)系統(tǒng)可以應對信息的爆增,包括網(wǎng)站、博客、電子郵件、視頻和新聞短片,尤其是物聯(lián)網(wǎng)時代傳感器收集上來的龐大信息流。
在通常情況下,數(shù)據(jù)分析的步驟是:首先搜集數(shù)據(jù),將其存儲在數(shù)據(jù)庫程序中,然后再用模型對數(shù)據(jù)庫進行搜索。這種高度結構化的方式通常需要耗費很多時間。在流計算模式下,先進的軟件算法在數(shù)據(jù)流入的同時即對其進行分析,機器可以實時分析上百個數(shù)據(jù)流,讓用戶在短時間內(nèi)對環(huán)境變化做出回應。
“可以設想一下,當智能交通深入應用時,駕駛員開車行進過程中,汽車可能會實時采集許多信息,有車速、溫度、交通流量、車輛間距等大量數(shù)據(jù)。當他來到一個路口時,其實最需要的是看到前方道路擁堵情況,可是傳感器采集來的各式各樣的數(shù)據(jù)會讓人迷惑不清,也增加了有效數(shù)據(jù)篩選的難度。” Meyerson舉例說,這個時候的智能,就不是以數(shù)據(jù)量的多少來衡量的,而是在合適的時候告訴駕駛員該直行,還是右轉。
如今,泛在計算發(fā)展迅猛,網(wǎng)絡、傳感器、計算機等價格急速下降,為物聯(lián)網(wǎng)的建設提供了技術上的可能性。復雜的實時分析處理和大范圍的傳感器數(shù)據(jù)需要不同的處理進程相互交叉校驗,IBM云交付管理系統(tǒng)設計與處理的多樣性讓IT資產(chǎn)的利用率得到優(yōu)化,比如使CPU使用率達到80%~90%。
除了基礎設施外,Meyerson認為,建設物聯(lián)網(wǎng)還必須著眼于“系統(tǒng)的系統(tǒng)”,就是要把各行業(yè)IT系統(tǒng)整合在一起,才能體現(xiàn)出多種多樣的可管理性。這也是處理高速膨脹的數(shù)據(jù)的另一個著眼點,即關注數(shù)據(jù)的流向。數(shù)據(jù)如何從眼前相對封閉的某個行業(yè)信息系統(tǒng)流轉到另一個應用系統(tǒng),而且保證數(shù)據(jù)始終有效。在很多情況下,數(shù)據(jù)在產(chǎn)生它的系統(tǒng)中能發(fā)揮作用,但當進入另一個系統(tǒng)時,由于格式、標準、體系的差異,很可能它就變成了垃圾數(shù)據(jù),無法發(fā)揮應有的效能。
物聯(lián)網(wǎng)要依賴數(shù)據(jù),更要控制好數(shù)據(jù)!