999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于機器學習的大數(shù)據(jù)平臺管理系統(tǒng)設計

2024-03-25 03:50:58袁帥臣
科技創(chuàng)新與應用 2024年8期
關鍵詞:機器學習

袁帥臣

摘? 要:伴隨互聯(lián)網(wǎng)技術的快速發(fā)展,網(wǎng)絡業(yè)務和互聯(lián)網(wǎng)流量數(shù)據(jù)呈現(xiàn)爆發(fā)式增長,進而影響互聯(lián)網(wǎng)大數(shù)據(jù)分析平臺,產生數(shù)據(jù)量和運維環(huán)境的變化,沖擊傳統(tǒng)的大數(shù)據(jù)平臺運維模式和數(shù)據(jù)技術方案。該文在總結機器學習在大數(shù)據(jù)分析平臺運維觀眾的應用的基礎上,分析聚類方法和回歸算法的特征,提出基于機器學習的大數(shù)據(jù)平臺智能化運維系統(tǒng)設計和監(jiān)控系統(tǒng)設計方法,為平臺運維人員監(jiān)控、排查和修復等問題提供便利。

關鍵詞:大數(shù)據(jù)平臺;機器學習;系統(tǒng)設計;監(jiān)控系統(tǒng);時間序列

中圖分類號:TP311.13? ? ? 文獻標志碼:A? ? ? ? ? 文章編號:2095-2945(2024)08-0110-04

Abstract: With the rapid development of Internet technology, the growth of network business and Internet traffic data is explosive, which affects the Internet big data analysis platform, resulting in changes in data volume and operation and maintenance environment and having impact on the traditional big data platform operation and maintenance mode and data technology scheme. On the basis of summarizing the application of machine learning in the operation and maintenance audience of big data analysis platform, this paper analyzes the characteristics of clustering method and regression algorithm, and puts forward the design method of intelligent operation and maintenance system and monitoring system of big data platform based on machine learning, so as to provide convenience for platform operation and maintenance personnel monitoring, troubleshooting and repair.

Keywords: big data platform; machine learning; system design; monitoring system; time series

在大數(shù)據(jù)背景時代,計算機技術及人們的學習方式發(fā)生了巨大變化,網(wǎng)絡系統(tǒng)及信息共享的擴展性和共享性不斷改進,也對網(wǎng)絡安全和傳統(tǒng)大數(shù)據(jù)平臺帶來挑戰(zhàn)。我國互聯(lián)網(wǎng)網(wǎng)民超過8億,其中網(wǎng)絡普及率也超過60%,網(wǎng)絡成為人們生活、工作及學習不可或缺的一部分。伴隨不斷升級和改造的互聯(lián)網(wǎng)基礎設施,使得人工智能、醫(yī)療健康及投資風控等應用場景出現(xiàn)在數(shù)據(jù)平臺中,網(wǎng)絡環(huán)境的安全問題越來越影響人們生活,網(wǎng)絡環(huán)境復雜多變,網(wǎng)絡犯罪也更加嚴重,可見,互聯(lián)網(wǎng)的發(fā)展也促進各國積極管理和應對網(wǎng)絡風險及安全策略,對傳統(tǒng)的大數(shù)據(jù)平臺及監(jiān)控體系提出了巨大挑戰(zhàn)。

劉雷等[1]以云南省政協(xié)大數(shù)據(jù)平臺建設為例,介紹平臺的建設內容和實施方案,重點對大數(shù)據(jù)平臺在政協(xié)背景下的關鍵內容進行較為詳細的梳理。付鵬[2]闡述了大數(shù)據(jù)背景下計算機網(wǎng)絡安全防范的重要性,分析了大數(shù)據(jù)背景下計算機網(wǎng)絡安全存在的問題,并進一步針對加強計算機網(wǎng)絡安全防范提出了有效措施。文聰敏等[3]針對當前軟件需求變更日漸增多但管理效率低下的現(xiàn)狀,總結了大數(shù)據(jù)平臺的特點,針對大數(shù)據(jù)平臺的計算能力和成本,提出了基于需求自動同步更新的管理系統(tǒng),并從總體設計、需求數(shù)據(jù)庫以及數(shù)據(jù)處理流程三個方面對其進行了闡述。白益洋等[4]通過二維碼及信息化大數(shù)據(jù)平臺精準錄入人員身份,進而實現(xiàn)住院醫(yī)師規(guī)范化培訓教學的體系化管理,同時依據(jù)實時生成的考核數(shù)據(jù)對教學質量進行監(jiān)控和反饋,達到對住培教學活動的良性互動和閉環(huán)管理。蘇健淵等[5]通過使用人工智能、大數(shù)據(jù)等前沿信息技術,搭建實訓基地智能化管理系統(tǒng),將實訓基地管理、維護、建設等多元信息集于一體,滿足實訓基地復雜化、多元化的管理要求,真正實現(xiàn)實訓基地的智能化管理,優(yōu)化實訓基地運行機制,提升實訓基地的管理效率和水平。張燕[6]以消防防控為研究對象,提出了一種多網(wǎng)融合的消防大數(shù)據(jù)平臺。大數(shù)據(jù)平臺的建設促進人們的學習方式改變,以機器學習為代表的人工智能技術為電力系統(tǒng)安全穩(wěn)定的發(fā)展提供新的思路[7]。徐楚原[8]分析了大數(shù)據(jù)技術的應用現(xiàn)狀,提出了環(huán)保智慧時代背景下機器學習的未來發(fā)展方向,旨在推動數(shù)據(jù)處理算法在生態(tài)環(huán)境領域的研究和應用,提高各類環(huán)境數(shù)據(jù)的處理效率。黃穎祺[9]針對最為關鍵的電能數(shù)據(jù)異常診斷難題,提出負荷回歸分析預測、基于神經(jīng)網(wǎng)絡的負荷預測、聚類分析和基于投影方法4種異常檢測方法,并對4種方法的準確性和有效性進行計算。王照翻等[10]以萬寧海域為例,研究了多光譜遙感數(shù)據(jù)與多類型機器學習算法的淺海水深反演方法,把機器學習算法應用海浪效應的評價。

綜上所述,大數(shù)據(jù)技術平臺、機器學習及信息技術在網(wǎng)絡安全、人員身份識別及生態(tài)環(huán)境領域應用較多,大數(shù)據(jù)的發(fā)展促進了人工智能技術的發(fā)展,基于機器學習及互聯(lián)網(wǎng)技術應用大數(shù)據(jù)平臺建設,為運維人員提供便利。

1? 時間序列聚集理論

時間序列是基于數(shù)理統(tǒng)計學和隨機過程理論,進一步研究隨機數(shù)據(jù)序列所遵循的統(tǒng)計規(guī)律,因此,時間序列分析被認為是一種動態(tài)數(shù)據(jù)處理的統(tǒng)計分析方法。基于動態(tài)數(shù)據(jù)處理可以解決實際問題,目前時間序列分析的方法一般包括自相關分析和譜分析方法,模式識別是時間序列聚集應用的主要模式之一,常被用于發(fā)現(xiàn)數(shù)據(jù)集頻繁出現(xiàn)的規(guī)律,比如在金融領域進行時間序列聚集分析,可以提供分析股票走勢,通過股票走勢可以得出相似金融企業(yè)的股票趨勢,不同股票趨勢的對比進而發(fā)掘企業(yè)之間的相互聯(lián)系。時間序列聚集最為常用的是相似性度量,基于特定的時間序列和原始數(shù)據(jù)表示特征計算。

2條時間序列之間的距離為

dist(Fi,F(xiàn)j)=∑dist(fit,fjt),

式中:T為時間,f為各時間點之間的距離,F(xiàn)表示長度為T的時間序列。時間序列聚集包括基于時間相似性的聚類、基于形狀相似性的聚類、基于結構相似性的聚類和基于時間序列長度的聚類4種類型。其中,時間序列的表示特征、長度特征影響著時間序列的距離計算,另外噪聲、振幅平移、振幅伸縮、時間軸伸縮、線性漂移及不連續(xù)也影響時間序列距離,距離具體的計算方法,如圖1所示。

由圖1可知 ,時間序列距離的計算與目標、長度層面和類型有關。其中類型從3個方面展開,即基于時間類型、形狀類型和模型,基于模型的方法計算,把相似的時間序列定義為產生相似的模型,因此在大數(shù)據(jù)平臺構建過程中,通過比較模型之間的相似性可以達到時間序列聚類的目的。目標方面基于時間相似性、形狀相似性和結構相似性,時間相似性是強調每一個時刻點開始計算的,在具體的應用中歐式距離更加適合大數(shù)據(jù)平臺中的時間序列聚類,但缺點是計算非常耗時,采用的原始序列,一般采取小波變換或傅里葉變換,最后對變換后的序列聚類;而形狀相似性的聚類在序列時間點上模式對于形狀相似性不重要,往往運用彈性方法中的動態(tài)時間規(guī)整進行相似計算,其中形狀特征包括全局特征和局部特征。

長度層面從形狀層面和結構層面進行計算。經(jīng)典的統(tǒng)計分析是基于假定數(shù)據(jù)序列具有獨立性開展的,但是時間序列分析更加側重研究對象和研究數(shù)據(jù)序列的互相依賴關系。其中,形狀層面計算采用相似性計算,通常是基于短時間序列聚類,另一方面結構層面是基于高級結構和全局的相似性為出發(fā)點,主要采用長時間序列數(shù)據(jù)計算,時間序列聚類算法如圖2所示。

2? 大數(shù)據(jù)平臺原始數(shù)據(jù)采集分析系統(tǒng)設計

基于統(tǒng)計學原理方法,對大數(shù)據(jù)平臺原始數(shù)據(jù)采集分析系統(tǒng)進行研究,深入分析網(wǎng)絡設備,進一步找出異常設備,及時反饋設備運維人員。大數(shù)據(jù)平臺原始數(shù)據(jù)采集分析系統(tǒng)基于時間序列聚類算法,充分利用相似性流量的網(wǎng)絡設備進行聚類,采取時間序列聚集理論,在進行決策依據(jù)時,通過增加的負載均衡器及數(shù)據(jù)之間的傳遞,降低數(shù)據(jù)負荷。從而為大數(shù)據(jù)采集服務器入口增加與之對應的負載均衡器。

目前現(xiàn)有的平臺網(wǎng)絡流量采集系統(tǒng)的架構如圖3所示。主要由3個模塊組成,即不同用戶采集模塊、網(wǎng)絡中間采集模塊和存儲分析數(shù)據(jù)模塊。

由圖3可知,不同用戶單元模塊為大數(shù)據(jù)平臺的原始數(shù)據(jù)輸入模塊,主要作用是采集各企業(yè)用戶的日常真實網(wǎng)絡流量,每日只要有流量訪問,設備就會產生日志信息;而中間的采集設備相當于大數(shù)據(jù)信息中轉站,負責不同單元用戶信息的處理,然后將處理后的信息轉發(fā)平臺,在不同城市區(qū)域都分布采集服務器,現(xiàn)有的網(wǎng)絡流量采集系統(tǒng)缺乏對用戶網(wǎng)絡設備的監(jiān)控和進一步的分析,另一方面網(wǎng)絡設備模式相同的情況下使得用戶在同一時刻處于波峰狀態(tài)或波谷狀態(tài),產生較大的流量,導致采集服務器出現(xiàn)性能瓶頸問題,產生資源浪費現(xiàn)象,降低了采集服務器的使用狀態(tài)。針對以上出現(xiàn)的問題,在傳統(tǒng)的架構中增加設備流量分析模塊和設備負載均衡模塊,進而提升設備的運行狀態(tài),提升網(wǎng)絡設備的效率,如圖4所示。

由圖4可知,通過一定的聚類,也可以發(fā)現(xiàn)異常數(shù)據(jù)網(wǎng)絡流量,一旦個別用戶設備的流量曲線與其他用戶有較大的差異,大數(shù)據(jù)平臺則認為設備有異常情況,后臺立刻將異常的信息反饋給運維人員,運維人員通過采集服務及相關幫助即可查明異常原因,從而進行有針對性的維修,運維人員可以針對設備的歷史流量數(shù)據(jù)進行深入分析,進一步挖掘其網(wǎng)絡流量的模式。

3? 大數(shù)據(jù)平臺智能化運維系統(tǒng)的設計

3.1? 大數(shù)據(jù)分析平臺監(jiān)控指標

大數(shù)據(jù)網(wǎng)絡流量監(jiān)控指標主要包含大數(shù)據(jù)平臺指標和業(yè)務指標兩大塊。大數(shù)據(jù)網(wǎng)絡服務器監(jiān)控指標和集群指標構成了大數(shù)據(jù)平臺指標;大數(shù)據(jù)業(yè)務指標類型較多,主要按設備數(shù)量、設備類型劃分的網(wǎng)絡流量大小及城市區(qū)域劃分的總網(wǎng)絡流量等,其檢測的時間間隔為10 min。大數(shù)據(jù)服務器的監(jiān)控指標見表1。

由表1可知,集群檢測監(jiān)測指標包括CPU、內存、磁盤讀寫等基本指標,還有HDFS、HBASE等大數(shù)據(jù)相關的監(jiān)測指標。不同的監(jiān)測指標,其檢測時間間隔不同,對于監(jiān)控指標變化較快的,采取間隔時間較短的辦法,監(jiān)測時間間隔對整個大數(shù)據(jù)集群有不同程度影響,因此要及時發(fā)現(xiàn)和處理不同的監(jiān)測指標。

3.2? 監(jiān)控系統(tǒng)設計

周期性監(jiān)控指標和非周期性監(jiān)控指標構成了大數(shù)據(jù)平臺網(wǎng)絡的監(jiān)控指標。對于含有趨勢性的指標或周期性監(jiān)控指標要預測指標走勢,對于指標的走勢要實時觀測,探尋規(guī)律,發(fā)現(xiàn)持續(xù)升高的現(xiàn)象要預測指標的設定閾值,及時通知網(wǎng)絡流量運維人員,盡早調查原因,并采取解決措施。

對于特別重要的監(jiān)控指標,監(jiān)控人員要收集或查看相關知識,可以采取監(jiān)督學習的方式進行,依托LIGHTGBM模型,實施實時異常檢測,提升監(jiān)控的效率,同樣,可以通過時間序列聚類算法進行聚類,對周期性監(jiān)控指標進行檢測,對于相同類簇的周期性監(jiān)控指標,訓練一個模型進行檢測,不斷滾動更新每一條監(jiān)控數(shù)據(jù),進而保存歷史監(jiān)控數(shù)據(jù),發(fā)現(xiàn)異常數(shù)據(jù),及時通知運維人員;而針對非周期性監(jiān)控指標僅通過設置網(wǎng)絡流量上下限閾值就可以完成本次監(jiān)控的任務,如圖5所示。

4? 結束語

企業(yè)大數(shù)據(jù)平臺的快速發(fā)展離不開互聯(lián)網(wǎng)技術,搭建有利于公司運營的大數(shù)據(jù)辦公平臺對大數(shù)據(jù)智能化運維至關重要,因此,有效的管理系統(tǒng)對大數(shù)據(jù)平臺的智能化運維至關重要,從根源上進行數(shù)據(jù)分析,及時發(fā)現(xiàn)大數(shù)據(jù)平臺設備的異常情況,保證平臺數(shù)據(jù)采集模塊的平穩(wěn)運行是關鍵。

通過時間序列模型聚類算法,提取相關模型參數(shù)及有用信息,進一步發(fā)現(xiàn)不同網(wǎng)絡流量采集設備的行為模式,在網(wǎng)絡流量設備監(jiān)控中采取波峰波谷錯峰的措施實施采集平臺的負載均衡,提出了基于大數(shù)據(jù)平臺監(jiān)控系統(tǒng)設計和大數(shù)據(jù)平臺原始數(shù)據(jù)采集分析系統(tǒng),利用機器學習回歸和分析算法,采取自動分析的模式,能夠快速識別網(wǎng)絡流量中絕大多數(shù)相關指標或異常數(shù)據(jù),及時告知運維人員,減少網(wǎng)絡流量設備的差錯,進一步滿足大數(shù)據(jù)管理平臺的指標監(jiān)控需求,以提高數(shù)據(jù)處理效率。

參考文獻:

[1] 劉雷,孫賢,朱靖.云南省“數(shù)字政協(xié)”及大數(shù)據(jù)平臺探索與實踐[J].科技創(chuàng)新與應用,2022,12(26):32-36.

[2] 付鵬.大數(shù)據(jù)背景下計算機網(wǎng)絡安全及防范措施分析[J].科技創(chuàng)新與應用,2022,12(2):124-126.

[3] 文聰敏,劉乃新.基于大數(shù)據(jù)平臺的需求自動同步更新管理系統(tǒng)設計與研究[J].現(xiàn)代信息科技,2023,7(14):7-11.

[4] 白益洋,董晉.基于信息大數(shù)據(jù)平臺的住培管理系統(tǒng)應用研究[J].現(xiàn)代信息科技,2023,7(11):156-159.

[5] 蘇健淵,梁曉昀,黃民聰.基于大數(shù)據(jù)平臺的實訓基地智能化管理系統(tǒng)建設[J].石河子科技,2023(2):75-76.

[6] 張燕.基于多網(wǎng)融合的消防大數(shù)據(jù)平臺系統(tǒng)設計[J].數(shù)字技術與應用,2022,40(8):200-202.

[7] 田芳,王曉茹.基于機器學習的電力系統(tǒng)安全評估及控制技術[J].供用電,2023,40(7):3.

[8] 徐楚原.機器學習在生態(tài)環(huán)境大數(shù)據(jù)中的應用[J].化工設計通訊,2023,49(8):177-179.

[9] 黃穎祺.基于機器學習的用戶側異常數(shù)據(jù)診斷研究[J].制造業(yè)自動化,2023,45(8):49-55.

[10] 王照翻,馬梓程,熊忠招,等.多光譜遙感數(shù)據(jù)與多類型機器學習算法的淺海水深反演方法評價[J].熱帶地理2023,43(9):1689-1700.

猜你喜歡
機器學習
基于詞典與機器學習的中文微博情感分析
基于網(wǎng)絡搜索數(shù)據(jù)的平遙旅游客流量預測分析
時代金融(2016年27期)2016-11-25 17:51:36
前綴字母為特征在維吾爾語文本情感分類中的研究
科教導刊(2016年26期)2016-11-15 20:19:33
下一代廣播電視網(wǎng)中“人工智能”的應用
活力(2016年8期)2016-11-12 17:30:08
基于支持向量機的金融數(shù)據(jù)分析研究
基于Spark的大數(shù)據(jù)計算模型
基于樸素貝葉斯算法的垃圾短信智能識別系統(tǒng)
基于圖的半監(jiān)督學習方法綜述
機器學習理論在高中自主學習中的應用
極限學習機在圖像分割中的應用
主站蜘蛛池模板: 无码国产偷倩在线播放老年人| 国产亚洲欧美在线视频| 色综合久久88色综合天天提莫| 日韩在线欧美在线| 午夜不卡视频| 女人一级毛片| 欧亚日韩Av| 精品久久蜜桃| 天堂成人av| 欧美黄网在线| 日本高清在线看免费观看| 国产在线视频福利资源站| 亚洲综合一区国产精品| 国产91小视频| 国产婬乱a一级毛片多女| 久久久国产精品免费视频| 久久久久久久蜜桃| 国产精品微拍| 免费高清自慰一区二区三区| 深夜福利视频一区二区| 亚洲三级a| 久久精品亚洲专区| 欧美第一页在线| 欧洲成人免费视频| 久久精品中文无码资源站| 日本在线国产| 77777亚洲午夜久久多人| 好紧好深好大乳无码中文字幕| 国产精品免费露脸视频| 精品福利国产| 国产黄色视频综合| 欧美日韩导航| 精品無碼一區在線觀看 | 2018日日摸夜夜添狠狠躁| 亚洲无限乱码一二三四区| 日韩欧美成人高清在线观看| 欧美性久久久久| 国产精品亚洲va在线观看| 亚洲91在线精品| 毛片网站在线播放| 免费观看欧美性一级| 国产高清色视频免费看的网址| 久草视频福利在线观看| 欧美午夜久久| av大片在线无码免费| 国产成人无码久久久久毛片| 中文字幕在线一区二区在线| 中国一级特黄视频| 波多野结衣无码中文字幕在线观看一区二区| 欧美成人日韩| 久久精品国产在热久久2019| 第一区免费在线观看| 欧洲一区二区三区无码| a毛片在线播放| 成人免费午夜视频| 园内精品自拍视频在线播放| 国产成人亚洲精品蜜芽影院| 欧美成人精品一级在线观看| 日韩在线欧美在线| 亚洲精品动漫| 国产在线观看成人91| 欧美一级在线| 在线观看视频99| 精品视频91| 国产福利在线观看精品| 思思热精品在线8| 九九热这里只有国产精品| 99re在线免费视频| 国产嫩草在线观看| 免费国产无遮挡又黄又爽| 情侣午夜国产在线一区无码| 亚洲精品制服丝袜二区| 精品1区2区3区| 国产免费一级精品视频 | 色综合天天综合| 日韩高清无码免费| 精品剧情v国产在线观看| 伊人AV天堂| 中文国产成人精品久久| 成人第一页| 欧美区一区二区三| 国产精品丝袜在线|