賈曉冬
(中國聯合網絡通信有限公司石家莊市分公司,石家莊 050000)
人類在2010年提出了“數字地球”的概念,此后這一概念的影響力在不斷增強,與此同時中國民眾的生活與物聯網技術的聯系越來越密切。社會各界對物聯網提出了更高的要求,而在目前的發展階段中,數據挖掘是物聯網技術所面臨的一大難題,本文就此展開討論。
云計算是在互聯網技術的基礎上提出的,該計算方式以用戶的需求為依據,通過互聯網為用戶提供相關服務。由于云計算的整個服務資源來源于互聯網內的數據,而且互聯網在顯示相關資源時也大多應用云狀圖案,因此該技術被稱作為云計算。在相關應用技術的基礎上,云計算的性能十分先進,具有規模較大的特點,就比如說谷歌云計算,就是由100多萬臺服務器構成。而其他的較大型搜索引擎也擁有數十萬臺服務器[1]。虛擬化也是云計算的顯著特征,用戶能夠在任意位置登錄,也能在任意終端實現服務器登錄。而這些操作步驟都在云空間內實現。云計算的另外一個特征是可靠性,在數據多副本絨促的作用下,應用數據的節點同構作用,實現可靠性服務。云計算的通用性特征十分明顯,不會特別針對某一項應用,而是創造出海量應用。此外,超大規模的云計算還能實現動態伸縮,如此一來,用戶日益增長的各類需求都能被滿足。
物聯網感知層能夠實現感知作用,通過在目標區域范圍內設置大量的數據采集點,實現有效的感知作用。通過傳感器和攝像頭完成數據采集工作。將采集到數據集中處理,此時要用到物聯網感知層的所具備的網路通信作用,這些被需要的數據會被傳送至各點,之后集中保存并再一次通過傳輸層到達云計算平臺的數據處理中心,此時整個感知層的職能就全部實現。數據傳輸的整個過程都要經歷的中間環節就是物聯網傳輸層,其中包含的技術有傳感器和無限網絡。多種設備連接在一起,構建的傳輸系統能夠高效率、無縫式傳遞信息。物聯網感知層在收集數據之后,通過傳輸系統能夠更有效地將收集到的數據傳輸至數據處理中心,此時全方位的互通互聯目標也能完整實現。仔細分析實際的工作內容,可以發現檢測處理設備具有多種屬性,將所指向的屬性相連接并實現聯網,不僅傳輸效率會明顯提高,還能在各設備節點之間完成信息傳播。
在數據挖掘服務層中,有數據準備模塊、數據挖掘引擎模塊,另外還有用戶模塊。在數據準備模塊中,能夠實現的功能有分析數據情況、轉變數據格式、制定數據規則。在數據挖掘引擎模塊中,具備的內容有挖掘數據算法、評估數據模式。而在用戶模塊中,涵蓋的功能是將數據挖掘的知識采用可視化手段展現出來。各種數據挖掘類型之間存在一定差異,因此數據挖掘引擎模塊的功能十分多元化,能夠對數據進行類似性分析、偏差性分析、趨勢分析、關聯分析、聚類分析,正是數據挖掘模塊中的算法集提供了上述多種功能算法。要想實現在Hadoop 平臺中挖掘相關算法,就要對傳統的數據挖掘算法進行適當調整,運用并行化模式處理相應算法。比如在用戶的直接接觸端,也就是物聯網數據挖掘平臺的用戶模塊,該模塊擔負著重要的職責,要將系統的信息轉化為用戶能夠識別的信息,因此該模塊必須要具備明顯的友好性。
異構性和海量性是物聯網數據的明顯特征,為此Hadoop 平臺在開發物聯網數據挖掘系統時要能夠較高質量開發物聯網數據挖掘系統,以實現更好存儲和處理物聯網數據。比如在某次構建物聯網數據挖掘系統時,建立了數據源轉換模塊和分布式存儲模塊。數據源轉換模塊實現的功能是轉換物聯網異構數據,分布式存儲模塊的功能是分布式儲存物聯網所產生的海量數據[2]。在分布式儲存模塊實現功能時,要依賴于Hadoop 云計算基礎的HDFS 文件系統。在顯示物聯網中的不同對象時,要用到不同的數據類型,因此物聯網的根本性特征便是異構性質,能夠比較直觀說明這一特點的情況是不同的對象要用不同的數據形式來表示。數據源轉換器的功能是保證數據存儲完整,同時也能保證挖掘工作科學順利地進行
綜上所述,物聯網數據挖掘會在云平臺技術的支持下獲得良好發展。在Hadoop 平臺的基礎上開發物聯網數據挖掘系統,能夠實現更加全面完善的功能。本文做出的功能實現分析在未來會進一步深入,提高數據挖掘的智能性和工作效率。