山東華宇工學院 高曉川
在新時期環境下,互聯網技術在各個行業中得到了廣泛使用,這也推動了物聯網技術得到快速進步與發展。在物聯網環境內,往往存在的數據呈現海量的特定,這些數據盡管數量和規模龐大,但其具備著很大的應用價值,因此各個行業逐漸對物聯網數據挖掘十分重視。為了更好實現物聯網數據的挖掘,云計算平臺為其提供了便利,下面,文章就主要針對基于云計算平臺的物聯網數據挖掘進行研究,希望對相關工作的開展提供幫助。
物聯網是現階段社會發展的產物,它將互聯網和各個行業實現密切聯系,有效推動了行業的信息化和智能化發展,對促進我國行業的現代化發展至關重要。在物聯網發展中,數據挖掘是重要的功能發揮途徑,如何實現物聯網內數據的有效挖掘是現階段物聯網發展中的重要內容,而云計算平臺對其數據挖掘提供了良好的技術支持,基于云計算平臺的物聯網如何進行數據挖掘,就是文章主要研究的內容。
對于物聯網來說,它主要是指借助各種信息的傳感器、GPS系統、激光的掃描器、紅外的感應器和射頻識別的技術等各類裝置和技術,對任何需要連接、監控和互動等物體或者過程內,聲、光、電、熱、力學、生物、化學和位置等所需信息進行采集,借助各類可能性的網絡實施接入,從而實現物和物以及物和人泛在的聯系,進而達到對物品智能感知、辨別與管理。在物聯網中,整體可概括成三大特征,主要包括充分借助現有技術對信息感知,通過電子標簽對基本信息進行了解;其對信息傳遞進行可靠性的提供,同時具備有線網絡的信息輸出和無限網絡的信息傳輸手段,常見的有借助傳感器的網絡和其它通信等進行信息的獲取和傳遞,且確保信息的傳遞具有良好可靠性;能夠實現數據的智能化處理,借助模糊識別和信息處理等技術能夠對海量、異構的數據實現高效地處理,促進信息整合有效性進行提升,確保數據的運用效率以及對物體的智能控制效果。
對于云計算來說,它是一種分布式的計算,主要是借助網絡云把巨大數據計算的處理程序實施無數個數量小程序的分解,后借助多部的服務器所構建的系統對小程序獲取的結果實施處理與分析,且向用戶進行反饋(云計算的概念示意圖如圖1所示)。云計算作為一種分布式計算的平臺,對大量的數據挖掘具有顯著的效果,能夠有效促進數據挖掘有效性的提升。通過分布式的數據處理法,能夠從分布式的存儲和并行計算的方面,有效實現對數據儲存、計算和容錯等要求的滿足,確保數據具有良好的安全性以及高性能?;诖?,谷歌提出分布式的文件系統化理論,且在行業內得到逐漸發展,且能夠對數據的存儲、搜索和分析等要求深層解決。在行業內,谷歌所研發開源系統在逐漸發展中形成了HDFS(Hadoop的分布式系統)、KFS(Kosmos文件系統),并組建成豐富化分布式的數據存儲體系。在行業市場內,所流行開源的云計算相關平臺有abiCloud和Hadoop平臺等。
對于數據挖掘來說,主要是從大量數據內通過算法對隱藏于其內信息進行搜索的過程。此數據挖掘常和計算機的科學存在密切關系,并借助統計、檢索、在線的分析和處理、機器智能學習、模式識別和專家系統等方法對上述目標有效實現。在數據挖掘中,包括諸多的步驟,主要有信息的收集、信息數據的集成、信息數據的規約、信息數據的清除、信息數據的轉變、信息數據的價值挖掘等。
通過互聯網技術的使用,對信息達到互聯互通目的,它把現實世界內的物體借助傳感器或者互聯網等手段實現了聯系,同時物聯網和云計算存在密切關聯,在物聯網內存在海量的數據通過云存儲方式而存在。在行業內對物聯網的使用中,主要以云計算的手段對海量數據實施整合與儲存,進而對數據價值實現挖掘,有效滿足數據挖掘預測和決策的需求,且反向對此類傳感網絡實施管控,讓其數據挖掘的結果對其物聯網內客觀事物呈現的運動規律以及發展進程等充分反應。在決策制定以及過程控制期間,數據挖掘至關重要,現階段它已從傳統模式的局限性內發生突破,且朝著物聯網方向轉變。
在此平臺內,想要實現數據挖掘的功能,需要借助諸多的技術,其中關鍵技術包括數據匯集的調度技術、服務調度與服務管理的技術、挖掘算法的并行技術等。
在數據匯集的調度技術方面,主要借助云計算各種類型的數據實現匯聚、調度,進而對不同類型數據達到連接與共享的效果,它也實現了多種數據的實時性和同步性連接。此技術在使用中主要對各類數據規約方面存在的問題實現解決,在對問題解決的方案設計時,要求其能夠對各類數據格式都能夠識別和銜接,從而對數據的充分分析與挖掘提供保障以及條件。
在服務調度與服務管理技術方面,是為了實現云計算對各類業務系統提供必要的服務,如服務調度以及管理功能等。其中在服務調度中,主要是基于對服務等級和資源匹配上,對優先級的服務實施調度,從而對服務間隔離和互斥等問題進行解決,確保云服務安全運行的空間滿足要求。而服務管理主要是把服務注冊和服務暴露的功能實現統一,對本地服務的能力可暴露性有效提升,對第三方的接入數據價值實現充分地挖掘。
在挖掘算法的并行技術方面,主要是云計算的平臺內將挖掘算法的并行化當作有效基礎能力的技術,包括選擇并行性的算法、可行性的算法和并行性的策略等,數據挖掘的算法主要有決策樹的算法和關聯規則的算法等,此云計算的平臺借助并行化的算法能夠對數據實現充分挖掘和利用。
文章主要是以云計算當作服務技術的物聯網平臺,在此平臺中將Hadoop當作基礎,借助有效平臺的搭建實現形影功能。根據實際運行的模塊分子,主要包括感知層、傳輸層和數據層,且還包括數據挖掘的服務層,具體結構如圖2所示。
3.2.1 平臺的感知層
平臺感知層其實是物聯網內終端形態的體現,其結構主要有物聯網的終端、移動通訊的控制終端、感知層接入的網關、終端的外設、感知層子網的節點以及卡識的讀物等。其中物聯網內存在兩部分,分別是終端的中間件與應用部分,在其內嵌入有遠距離的通信模塊,其終端的中間件匯聚和封裝著終端的能力,而終端的應用主要是在終端駐留的應用作用發揮。在終端的外設方面,主要包括GPS、傳感器、攝像設備、條碼的讀寫器和控制器等裝置;在卡識的讀物方面,主要包括條碼、RFID的標簽等;在感知層的接入網關方面,主要是把感知層的子網接入到運營商的網絡內的一些網關類設備;在感知層的子網方面,主要有無線型傳感器的網絡、有線的局域網和WiFi類網絡等;在子網節點方面,主要是接入至感知層接入的網關內感知層子網終端的設備,有節點的中間件、節點的應用等部分。
3.2.2 平臺的傳輸層
平臺的傳輸層作為一種高速和無縫等特點的數據傳送網絡,它具備諸多網絡的形態,可以快速和靈活地把感知數據向云計算的數據中心內傳輸,達到全面性和有效性互通互聯的目的,還可以把各類的監測設備實現聯網數據的傳輸,使物聯網內監測設備對數據實現網絡化的高速傳輸效果。
3.2.3 平臺的數據層
數據層是數據挖掘相關平臺的核心和關鍵部分,此層根據功能需求主要分作兩個部分,分別是數據源的轉換模塊與數據挖掘的部分。對于物聯網的數據挖掘功能平臺,數據層發揮著重要的作用,因為物聯網內的數據呈現出海量性、無序性與異構性等特征,當數據層在對此類數據實施處理與儲存中就需要能夠對它們實現功能的可行性與有效性。此數據層內,涉及有兩個模塊,分別為數據源的轉換模塊以及分布式的存儲模塊。其中前者主要用在對平臺內異構性的數據開展轉換處理活動中,而后者和Hadoop的平臺內所存在HDFS的文件系統實現結合,以分布式的方式對物聯網內海量的數據存儲。
結語:綜上所述,物聯網內數據挖掘對其數據價值的發揮具有著至關重要的作用,云計算在物聯網的數據挖掘中發揮著重要的功能,文章從數據感知層、數據傳輸層、數據層和服務層等部分對基于云計算平臺的物聯網數據挖掘平臺實施研究,對各部分組成和功能實現進行了分析,往對相關領域的研究具有參考價值。