1.吳桂軍 2.曹 爽
1.重慶工程職業技術學院 2.重慶市民族職業中學
物聯網技術的發展有效滿足了現代社會的要求,但是在實際上,我國的物聯網發展水平依然處在一個相對較低的水平,其智能化、信息化程度較低,尤其是海量異構數據的管理,其數據存儲與數據共享都難以滿足現代社會要求。因此對相關人員而言,必須要重點研究物聯網條件下海量異構數據存儲與共享的相關問題,為進一步提高物聯網的實施效果奠定基礎。
在物聯網海量異構數據存儲過程中,考慮到異構數據的特殊性,很多技術人員傾向于采用集中式的存儲管理方法,在這種管理方式下,文件系統的存儲方式會因為效率因素的影響而難以滿足異構數據存儲的要求,所以針對這種情況,本文提出了數據庫式的異構數據存儲方式。
數據庫技術主要被分為關系型數據庫與非關系型數據庫兩種,其中關系型數據庫的技術條件十分成熟,并且能夠精準描述數據中的相關數據,在數據存儲中能夠最大程度上保證數據存儲的完整性與一致性。但是在使用該技術時應該注意的是,關系型數據庫技術強調了數據的實時到達,在實際上是以一個完整的時間序列形式運行的。相比之下,非關系型數據庫技術屬于一個新興技術,通過PC搭建平臺,依靠PC平臺來完成數據的深層次處理。所以,非關系型數據庫技術也具有適用性,能夠為海量異構數據處理提供必要的技術支撐。
在存儲技術應用中,都需要針對物聯網海量異構數據的實際情況,對數據進行預處理,并采用統一的方式對數據進行編輯,這樣才能保證異構數據被順利的儲存。結合非關系型數據庫的特征,在這個過程中,所要采取的技術措施主要包括:
(1)預處理。先對物聯網海量異構數據做預處理,這是因為物聯網中的采樣數據中存在大量的噪聲數據,再加之物聯網節點本身的數據處理能力是有限的,所以為了能更高效的編輯處理相關數據,就需要通過數據清洗、數據融合等多種手段,讓異構數據中的關鍵值能被提取。
在預處理階段,考慮到不同傳感器的類型存在差異,因此在數據預處理過程中,必須要針對數據的具體屬性做出針對性的編輯。例如,對于那些非數值的數據,應該根據視頻、音頻數據的應用要求,按照相應的算法來獲取其中的關鍵值參數;而對于數據型的模型,還應該關注數據之間本身所產生的變化,當數據經過預處理后,將其定義成一個閾值,當數據的狀態變化超過這個閾值之后,再進一步提取數據。
(2)數據表達。針對相關學者的研究經驗[1],在數據表達階段,采用非NoSQL數據庫存儲策略。在這個策略中,數據表達必須要經過三個層次的變化,分別是數據元素、數據記錄與數據集合。其中,數據元素是物聯網海量異構數據中的基礎數據,可以被認為是異構數據最基本的表現形式;數據記錄則是不同數據之間的變化,反應了數據在接受“被存儲”過程中所接受的數據預處理流程;數據集合,就是要對那些被預處理的數據進行整合。在數據表達結算,數據往往會以兩種狀態存在,分別是靜態信息與動態信息。其中,動態信息主要指與時空有效的信息,包括溫度信息、時間信息等;靜態信息值只采集以此的信息,例如物理網異構數據階段中的ID信息等。在這些信息的表達中,其表達方式均指向了原子信息的開始位置,分別由字符類型與數值類型兩方面組成,兩者相互結合共同完成了數據的表達,并與非關系型數據庫相匹配。
在物聯網的數據共享中,數據交換標準定義了物聯網數據交換協議與共享方式,從當前技術發展情況來看,REST等已經成為物聯網中最常見的應用層技術交換標準,能夠在一些特定行業的充分利用。
在這種情況下,大量的數據共享策略得到應用,并且相關學者也對物聯網下異構數據的共享策略[2],并分別從DNS、REST等諸多方面,介紹了相關共享策略的實施效果。總體而言,現階段物聯網海量異構數據的共享策略主要面臨著一個問題:面向物聯網海量數據往往會因為缺乏共享機制,而導致物聯網應用閉環現象廣泛的存在。所以為了解決這個問題,本文提出了共享策略,這個共享機制以REST的信息服務解決數據共享問題,在數據共享階段,所要解決的問題問題主要包括以下幾方面:
(1)資源定義。根據REST的設計原則,一切可以被命名的實體都可以被認為是資源,這些資源不僅包含了傳統網絡系統中的各種鏈接、信息,也包括物聯網中的感知網絡、交互信息等多種資源。在信異構數據共享中,必須要針對單個物體對象所對應的資源,通過單條數據記錄、數據記錄集合等方式,完成相應的數據索引,這樣相關人員才能快速的依靠關鍵詞等檢索條件快速獲取信息,完成數據共享。
(2)確定標識。在對需要被共享的資源進行定義之后,考慮到資源描述已經成為信息服務系統并實現資源管理的基礎。所以當資源定義后,應該結合異構數據的特點,確定標識,掌握資源所在網絡的性能、應用領域等諸多信息后,對相關資源做進一步的確定與劃分,明確資源的具體信息,為共享做好準備。
(3)數據共享。當異構數據的標識被確定之后,證明此時的異構數據已經完成了定義,依靠相應的數據庫技術,相關人員就能在關鍵詞檢索、約束條件控制等多種方式下獲取具體的異構數據信息,最終完成了對數據的共享。
物聯網海量異構數據的存儲與共享對相關數據的應用產生深遠影響,因此對相關人員而言,必須要進一步了解物聯網海量異構數據的深層次管理要求,在充分了解異構數據處理要求的基礎上,對相關數據進行編輯,確保其存儲與共享策略能夠滿足應用要求,最終更好的滿足社會生產。
[1]任海鵬.互聯網下大數據研究方法與探究[J].赤峰學院學報(自然科學版 ),2015,31(22):14-15.
[2]李昱慶.物聯網信息服務系統研究綜述[J].現代計算機(專業版),2014(07):23-29.