999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于云計算技術的分布式網絡海量數據處理系統構建

2023-06-15 05:26:44楊曉嵐
無線互聯科技 2023年2期

楊曉嵐

摘要:隨著我國互聯網用戶群體的不斷擴大,提升數據的挖掘、分析以及應用能力是未來互聯網技術發展的重要方向之一,特別是經濟社會的發展導致人們對數據處理的需求越來越高,現有的海量網絡數據處理系統方案已經不能滿足人們的需求。因此,探索將云計算技術應用于分布式網絡海量數據處理系統的構建中,能充分發揮云計算技術與分布式網絡的優勢,從而提高海量數據的處理效率。

關鍵詞:云計算技術;分布式網絡;海量數據;處理系統

中圖分類號:TM73中圖分類號? 文獻標志碼:A文獻標志碼

0 引言

隨著我國互聯網技術的不斷發展,截止到2020年,我國的互聯網用戶已經超過了10億,互聯網技術進入千家萬戶,成為人們日常生活的必備工具,這也為網絡技術的發展帶來了新的機遇[1]。龐大的互聯網用戶中的大部分會參與到網絡購物中,以淘寶、拼多多、京東等為主的網絡購物平臺成為便利人們生活的重要手段。在用戶進行互聯網活動時,不可避免地會產生數據,而通過對這些數據的分析能夠更好地推動互聯網技術的發展創新。因此,學會對網絡海量數據進行處理,是促進互聯網發展的有效途徑。本文將云計算技術與分布式網絡數據處理相結合,構建一個數據處理系統,以此來更好地對用戶需求進行分析、處理。

1 基于云計算技術的海量數據處理需要解決的問題

要想搭建基于云計算的數據處理系統,需要推動其在高速流數據特征的海量感知數據的分布式儲存技術,而這種簡單化的、高效的海量異構感知數據分布式知識發現和并行化數據挖掘算法,需要解決以下問題。

1.1 儲存問題

互聯網平臺中,感知層的傳感器節點、監控終端以及RFID的標簽種類多樣,且不同的節點擁有不同的功能特征,會導致最終采集的數據并不一致,儲存方式也會有明顯的不同。例如數據會存在動態數據與靜態數據兩類,其對于儲存的需求并不一致,要想實現其在數據儲存系統中的有效儲存,必須搭建多態異構的感知數據儲存方案,從而使得不同結構的數據都能夠得到有效儲存,從而便于后續的處理工作[2]。

1.2 時效性問題

在龐大的互聯網中,每分每秒所產生的數據數量都是龐大的,如果將所有數據都進行儲存,很可能會導致數據系統的崩潰。同時搜集到的海量數據并不一定有用,如果單純地對所有數據都進行備份,那么在長期的系統運行中會減緩系統的運作效率。因而在設計基于云技術的分布式海量數據處理系統時,要充分考慮數據的時效性,通過數據篩選的方式來提高系統的數據處理效率,也能夠增強系統的可靠性。

1.3 分析挖掘問題

在對海量數據進行搜集時,通常不會進行結構化的劃分,而是以原始數據的形式納入數據處理系統中,通過圖結構、序列等特殊的結構來對數據進行分析,而對于一些非特征的數據不能直接使用數據挖掘算法,如何解決這些非結構性數據的挖掘工作成了亟待解決的問題。這需要在搭建數據處理系統時注重對數據挖掘算法的效率提升,從而實現在時空非向量空間中直接執行分析挖掘操作的算法[3]。

2 分布式網絡數據的特征及其設計思路

分布式網絡是通過不同的終端設備連接而形成的網絡結構,與傳統的網絡結構相比,其能夠在某條線路出現故障時依靠其他終端設備維持網絡的運行,從而體現出較高的適應,提升網絡的適應范圍。這種突出優勢使得在網絡技術發展的過程中,分布式網絡得到了有效的推廣,成為最常用的網絡結構之一[4]。但正是由于分布式網絡的端口多,獲取到的數據也更加繁復,這無疑會增加系統的工作量,不利于對海量數據進行處理。為了提升分布式網絡的處理效率,在研發的過程中不少團隊會傾向于使用分析算法以及模糊聚類算法,從而能夠對數據進行集中的處理,但其應用效果也十分有效,常常需要較長的時間進行分析,如果將其應用于數據挖掘工作中,會使得挖掘效率大大降低,因此探索將云計算技術納入分布式網絡研究成了當下的熱點。

要想實現云計算技術上的分布式網絡海量數據處理系統的設計,需要在充分了解兩者特性的基礎上,從數據處理系統的實際需求入手,分析海量數據的特點,從而促進系統設計的完善。在這個過程中,最重要的是發揮云計算技術與分布式網絡的優勢,對分布式網絡的研究發現,其能夠在短時間內產生海量數據,通常一天內就能夠獲取數百萬條信息,而要想對這些數據進行處理,需要經過一系列的流程才能保障每條信息都能得到妥善處理,而這個處理過程勢必會較其他的網絡結構較長[5]。因此,在設計時要充分發揮云計算的優勢,將其應用于分布式網絡的數據挖掘中,根據數據特性、數據種類等方式對數據進行分區處理,從而提升數據處理系統的效率。以熱點數據識別為例,在數據挖掘的過程中出現頻率較高的數據則被稱為熱點數據,利用云計算技術將熱點數據從海量數據中脫離出來,并建立專門的數據庫,從而便于數據的識別。通過熱點數據識別的方式,能夠縮減數據的檢索范圍,是系統的處理系統在合理的負載范圍內。同時要認識到分布式網絡的龐大數據量,根據數據的來源對其進行分類處理,可以提升處理效率。在云計算技術的支持下,分布式網絡能夠對數據處理的要求進行分解,將原本復雜的任務轉化為一個個工作量較小的任務,通過多端共同處理的方式來分解一個端口的壓力,促進數據處理系統的穩定。

3 基于云計算技術的分布式網絡海量數據處理系統設計

3.1 轉變處理思路

分布式網絡海量數據處理系統與傳統的數據處理系統之間有著明確的差異,在應用過程中研發人員必須明確分布式網絡的特征,在致力于促進云計算技術融合的基礎上進行系統搭建,可以實現對數據系統處理思路的轉變。將云計算與分布式網絡聯合后,能夠大大地提升系統對于海量數據的處理效率,從而滿足數據處理的需求。在這個過程中,做好對數據的定位就顯得至關重要。海量的數據要進行挖掘必須經一定的特性進行引導,如熱點數據就可成為數據的一種特性,經過定位的數據能夠減少數據挖掘的工作量,在短時間內實現對數據的挖掘,以此來促進系統處理效率的提升。以云計算技術作為系統優化的手段,為數據處理提供多一層的保障,從而促進數據處理的正確率提升[6]。

3.2 建立數據挖掘模型

將數據挖掘技術以模型的形式呈現,推動了云計算技術在系統設計中的應用,能夠對海量數據實現明確的分類,從而促進數據處理有效性的提升。在這個過程中,研發人員要建立基于數據挖掘技術的基本模式,將各項數據處理活動有序地連接起來,從而促進數據挖掘的展開。數據挖掘基本模型可分為3個層次,分別為用戶層、運算層與服務層。在服務層中依托于HDFS、MapReduce、Hadoop技術建立一個云計算環境,將個網絡節點連接到一起從而形成一個循環相連的網絡結構,為用戶層與運算層提供服務。運算層中主要運行海量數據的挖掘機優化工作,以聚類算法、分類算法、回歸算法、關聯規則等將各數據關聯起來,對數據進行抽取、轉換、清洗、集成以及加載,實現數據的預處理。最后的用戶層分為用戶輸入模塊與結束展示模塊兩部分,在輸入過程中根據數據挖掘技術對其提供個性化的應用,而結束時則體現為Web服務與知識流。通過3個層次之間的相互聯系,彼此之間展開數據交換,一方面用戶通過數據輸入來獲取自身的預期信息,另一方面對數據挖掘、分析的過程也會不斷優化系統的運作方式,提供數據展示的準確性,從而達到數據處理的效果。

3.3 節點設計

基于云計算的分布式網絡海量數據處理系統的建設,最主要的就是對節點的設計,而其中中心控制節點尤為重要。中心控制節點是整個系統中的核心,通過中心節點能夠控制系統內部的所有環節,并起到分配任務的作用,是系統調節和運轉的關鍵[7]。考慮到意外情況,中心控制節點需要使用雙機熱備的方式來進行備份,一般而言中心控制節點下包括通信模塊、任務調度模塊、任務管理模塊、鎖管理等多個模塊。以通信模塊為例,其是中心控制模塊與其他模塊之間的溝通橋梁,負責對數據處理任務的分發,同時建立不同模塊之間的聯系。而任務管理模塊是對數據處理任務進行管理的模塊,包括對任務的建立、對任務的分解以及任務的執行與維護等,凡與任務相關的環節都需要經過任務管理模塊。任務調度模塊則是負責任務的調度工作,如能夠根據任務的需求及用戶的要求對任務的實施進行安排,包括鎖進程的維護與管理等。除此之外,定時器模塊主要是對系統的數據處理時間進行監督,從而保障系統的處理效率。當系統的處理時間超過預期時間后,則會對超時的情況進行記錄,包括超時處理后導致后續處理工作的障礙等,以此來完成系統運行狀況的檢測。一旦出現超時處理,表明系統在運行過程中受到了阻礙,使得預期的目標難以實現,那么在解決問題時不僅要注重當下,更要對以后數據處理過程設定備用程序,避免相同的問題再次出現。

3.4 云儲存方案

在云計算技術的支持下,通過對分布式網絡海量數據進行分析,發現其搜集的數據具有異構性、不確定性,同時數據龐大,常規的儲存方式難以滿足系統的建設需要,因此通過云計算技術提高數據處理系統的儲存功能具有良好的應用前景。在設計云儲存方案時,要注重與提升數據儲存的可擴展性、容錯性,同時降低數據處理系統的運作能耗,在設計中以3層儲存結構的方式來搭建云儲存方案。其中第一層運行支撐數據,第二層運行結果數據,第三層則是儲存歷史數據,根據數據的性質不同將其劃分到不同的數據儲存層次,從而科學化、規范化地進行云儲存。至于對數據的分類由中央儲存進行調度,根據需求將其分布到3層儲存層中,但這3個儲存層并不是完全獨立的,而是彼此相互印證。以歷史數據儲存層為例,其是對處理過的數據進行儲存,從而將新的數據轉變為歷史數據的層次,在支撐數據和結構數據的每次運行結束后,都會將數據送入到歷史數據層,實現對歷史數據層的豐富,而在對歷史數據層進行調度的過程中,也需要支撐數據與結果數據的支持,從而使得所調度的數據具有一致性。這樣的分層云儲存方式能夠將海量數據處理系統中的數據進行分類儲存,既便于對數據系統的管理,又能夠實現數據的及時調度。云儲存的方式也能減少系統本身的能耗,使得系統運作效率大大提升,這是對云計算技術的有效利用。

3.5 優化系統運行算法

系統運行算法直接關系到系統對數據處理的效率,研發人員在進行系統設計的過程中,要遵照云計算技術與分布式網絡的特性,優先使用SPRINT算法來進行系統運算。SPRINT算法又被稱為決策樹算法,其分為兩個步驟:(1)由數據的根節點形成并對遞歸的數據進行分片,從而實現對樹的生成;(2)去除一些可能是噪音或異常的數據來完成樹的修剪,以此來進行決策樹的創建。在建立基礎的決策樹模型后,研發人員要對決策樹的使用狀況進行調試,以多次數據處理的形式來不斷挖掘決策樹運行中可能出現的問題,并針對這些問題進行優化完善,使得決策樹的結構更加符合分布式網絡海量數據處理系統的需求,同時優化決策樹的過程勢必將提升決策樹的運作效率,對于優化系統運作模式有著重要意義。決策樹算法的過程,可根據用戶的需求設置個性化應用,例如設置索引、類別等來方便用戶的查詢,使得用戶能夠在短時間內實現對數據的搜集工作。在這個優化系統算法的過程中,工作人員也要對數據處理的任務需求進行分析,對不同數據的分類要求進行歸納,從而提升數據處理的有效性。

4 結語

海量數據處理系統是在網絡時代實現數據處理的最佳途徑,而將云計算技術與分布式網絡海量數據處理系統結合起來,能夠有效地提升其對于龐大的數據流的處理效率,同時以數據分類的方式實現對數據的精確分析,這使得數據處理的準確性得到了較高的提升。而云計算技術對于數據處理系統的優勢在于其能夠為系統提供云計算與云儲存,將原本的海量數據以云儲存的方式儲存在網絡中,能夠減輕系統的處理負擔,使得數據處理系統的處理時間縮短,提升系統處理效率。在未來,云計算技術將為分布式網絡海量數據處理系統的優化帶來更多好處,兩者之間的融合研究具有良好的發展前景。

參考文獻

[1]劉巧利.云計算技術在分布式網絡均衡負載控制中的應用[J].信息與電腦(理論版),2021(4):28-30.

[2]盧鵬,蘆立華.基于云計算技術的分布式網絡海量數據處理系統設計[J].現代電子技術,2020(18):36-39.

[3]任尚云.云計算環境下網絡空間數據分布式存儲方法研究[J].信息通信,2019(8):21-22,25.

[4]周艷艷.基于云計算下網絡流媒體分布式存儲與分配優化策略[J].電腦迷,2018(8):235.

[5]畢云星.云計算環境下的網絡技術及應用實踐研究[J].數碼世界,2017(12):554.

[6]袁超.面向分布式網絡的跨異構域認證密鑰協商及加密算法研究[D].成都:西南交通大學,2017.

[7]楊波.分布式網絡中海量空間特征數據檢測仿真[J].計算機仿真,2017(3):427-430.

(編輯 李春燕編輯)

Construction of distributed network mass data processing system based on cloud computing technology

Yang? Xiaolan

(Shanxi Vocational and Technical College, Taiyuan 030000, China)

Abstract:? With the continuous expansion of my countrys Internet user groups, improving data mining, analysis and application capabilities is one of the important directions for the development of Internet technology in the future, especially the economic and social development has led to peoples increasing demand for data processing , the existing massive network data processing system solutions can no longer meet peoples needs, so exploring the application of cloud computing technology to the construction of distributed network massive data processing systems can give full play to the advantages of cloud computing technology and distributed networks. Thereby, the processing efficiency of massive data is improved.

Key words: cloud computing technology; distributed network; massive data; processing system

主站蜘蛛池模板: 国产浮力第一页永久地址| 亚洲AV无码乱码在线观看裸奔 | 97超级碰碰碰碰精品| 国产菊爆视频在线观看| 夜色爽爽影院18禁妓女影院| 亚洲 欧美 偷自乱 图片 | 中文字幕 91| 拍国产真实乱人偷精品| 国产簧片免费在线播放| 亚洲精品在线91| 57pao国产成视频免费播放| 国产黄色视频综合| 亚洲码一区二区三区| 波多野结衣国产精品| 国产成人一二三| 美女潮喷出白浆在线观看视频| 亚洲色无码专线精品观看| 亚洲制服丝袜第一页| 久夜色精品国产噜噜| 精品91在线| 亚洲第一福利视频导航| 国产精品视频第一专区| 天堂成人在线| 丁香五月亚洲综合在线 | 真人免费一级毛片一区二区| 国产高清精品在线91| 青青草原国产av福利网站| 日韩精品亚洲人旧成在线| 国产91精品调教在线播放| 中文字幕无线码一区| 欧美一区二区丝袜高跟鞋| 亚洲性色永久网址| 一级毛片在线播放| 日本在线国产| 亚洲伊人电影| 免费av一区二区三区在线| aaa国产一级毛片| 91无码人妻精品一区| 久久福利片| 日韩国产黄色网站| 毛片免费网址| 亚洲日韩Av中文字幕无码| 97超碰精品成人国产| 亚洲精品麻豆| 欧美人与牲动交a欧美精品| 在线一级毛片| 免费日韩在线视频| 亚洲AV永久无码精品古装片| 国产丝袜精品| 欧美一级视频免费| 黑色丝袜高跟国产在线91| 91口爆吞精国产对白第三集 | 波多野结衣无码AV在线| 成人福利免费在线观看| 国内精品久久久久鸭| 久久久亚洲国产美女国产盗摄| 中文字幕有乳无码| 国产丝袜第一页| 香蕉久久国产超碰青草| 免费一极毛片| 2021国产精品自产拍在线| 国产Av无码精品色午夜| 手机精品视频在线观看免费| 午夜国产大片免费观看| 日韩无码一二三区| 亚洲an第二区国产精品| 精品国产免费第一区二区三区日韩| 免费不卡在线观看av| 亚亚洲乱码一二三四区| 欧美中文一区| 91网址在线播放| 91探花国产综合在线精品| 青青热久麻豆精品视频在线观看| 黑人巨大精品欧美一区二区区| 亚洲视频欧美不卡| 午夜福利视频一区| 国产美女91视频| 国产在线视频福利资源站| 免费激情网站| 不卡国产视频第一页| 全午夜免费一级毛片| 久久99国产视频|