999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于jupyter的大數(shù)據(jù)分析工具在網(wǎng)絡(luò)優(yōu)化領(lǐng)域的應用研究

2021-07-20 08:54:36蔡林
中國新通信 2021年9期
關(guān)鍵詞:大數(shù)據(jù)

蔡林

【摘要】 ? ?目的:介紹Jupyter Notebook在網(wǎng)絡(luò)優(yōu)化領(lǐng)域的應用情況。方法:集成Hadoop、Spark、Jupyter Notebook 等開源工具,搭建網(wǎng)絡(luò)優(yōu)化分析平臺,基于真實案例驗證其在網(wǎng)絡(luò)優(yōu)化領(lǐng)域應用的可行性。結(jié)果:通過搭建大數(shù)據(jù)計算環(huán)境,成功實現(xiàn)多數(shù)據(jù)接入、分布式運算、分布式存儲、交互式應用及結(jié)果展示等功能,并基于該平臺完成網(wǎng)絡(luò)整體問題分析、問題原因定位分析、問題處理方案分析、問題處理效果分析等大數(shù)據(jù)分析任務。結(jié)論:結(jié)合網(wǎng)絡(luò)優(yōu)化的大數(shù)據(jù)分析需求,搭建便于使用的大數(shù)據(jù)分析環(huán)境,提升基于大數(shù)據(jù)的網(wǎng)絡(luò)優(yōu)化分析能力。

【關(guān)鍵詞】 ? ?大數(shù)據(jù) ? ?Jupyter Notebook ? Hadoop ? ?Spark ? ?分布式計算 ? ?網(wǎng)絡(luò)優(yōu)化

引言:

隨著無線通信網(wǎng)絡(luò)的快速發(fā)展,網(wǎng)絡(luò)優(yōu)化信息化、智能化建設(shè)進入了突飛猛進的發(fā)展階段,積累了大量的MR(測量報告)、PM(性能數(shù)據(jù))、NRM(網(wǎng)絡(luò)資源管理)、工參等基礎(chǔ)數(shù)據(jù)。這些數(shù)據(jù)資源的價值還未能充分的挖掘,如何從各維度大量數(shù)據(jù)中發(fā)現(xiàn)可用的信息,加速網(wǎng)絡(luò)優(yōu)化信息化、智能化進程是迫在眉睫的任務。通過對網(wǎng)優(yōu)大數(shù)據(jù)特性及網(wǎng)優(yōu)工作協(xié)作方式與Jupyter Notebook進行結(jié)合性研究,實現(xiàn)有效的且適用于網(wǎng)優(yōu)的大數(shù)據(jù)分析,以滿足網(wǎng)絡(luò)優(yōu)化分析需求。

一、 jupyter與網(wǎng)絡(luò)優(yōu)化分析處理的結(jié)合

1.1 Jupyter Notebook[1] 技術(shù)與網(wǎng)絡(luò)優(yōu)化分析應用結(jié)合

Jupyter是一個可交互的記事本,支持了Python[2]、Julia、JavaScript、R等等編程語言達40 多種。它是一個開源的Web 應用程序,在其環(huán)境中可以運行代碼和記錄代碼,可以對數(shù)據(jù)進行清洗,可以通過可視化視圖查看數(shù)據(jù)結(jié)果,可以進行大數(shù)據(jù)相關(guān)的數(shù)模轉(zhuǎn)換、模型構(gòu)建、機器學習訓練等。

如圖1所視,Jupyter Notebook的系統(tǒng)架構(gòu)包括人機交互、瀏覽器、服務器、核心、文件等,其中服務器為核心構(gòu)件。網(wǎng)優(yōu)分析人員通過瀏覽器連接到服務器,在Web中編寫代碼并將代碼發(fā)送到內(nèi)核,由內(nèi)核執(zhí)行,于將結(jié)果反饋到Web頁面。個人編寫的代碼保存在服務器中,可共享給其他人員使用。

1.2 JupyterHub[3]技術(shù)與網(wǎng)優(yōu)工作流程結(jié)合

JupyterHub支持多個用戶(包括管理人員、網(wǎng)優(yōu)人員和維護人員等)同時構(gòu)建自己的工作空間和計算環(huán)境,共享或使用其他人的資源,以達到聯(lián)機協(xié)作的目的。

1.3 HDFS[4]與jupyter結(jié)合作大數(shù)據(jù)存儲

Hadoop分布式文件系統(tǒng)(HDFS)是指被設(shè)計成適合運行在通用硬件(commodity hardware)上的分布式文件系統(tǒng)(Distributed File System),用于存儲網(wǎng)絡(luò)優(yōu)化分析所需的各類型各維度數(shù)據(jù)。

1.4 Spark[5]與jupyther結(jié)合作大數(shù)據(jù)計算

Spark 提供了80多個高級運算符。一方面,Spark提供了支持多種語言的API,使得用戶開發(fā)Spark程序十分方便。另一方面,Spark是基于Scala語言開發(fā)的,使得Spark應用程序代碼非常簡潔。同時由于spark基于內(nèi)存,在網(wǎng)優(yōu)大數(shù)據(jù)處理領(lǐng)域,性能比hadoop快。

二、基于jupyter的網(wǎng)絡(luò)優(yōu)化分析平臺架構(gòu)

網(wǎng)絡(luò)優(yōu)化分析平臺的建設(shè)面向基于大數(shù)據(jù)的網(wǎng)絡(luò)分析優(yōu)化需求,以網(wǎng)優(yōu)問題分析定位為主要目的,結(jié)合MR、PM、NRM、CM等數(shù)據(jù)特點,主要以滿足網(wǎng)絡(luò)優(yōu)化問題定位為主。網(wǎng)絡(luò)優(yōu)化分析平臺的總體架構(gòu)圖見圖2,包括網(wǎng)優(yōu)數(shù)據(jù)的采集解析、基于不同數(shù)據(jù)類型的分布式存儲、各類型數(shù)據(jù)不同維度的分布式運算、各類型數(shù)據(jù)的組合應用層以及用戶界面應用。

2.1 用戶界面

界面提供給網(wǎng)優(yōu)工作人員進行網(wǎng)優(yōu)工作信息交互,實現(xiàn)網(wǎng)絡(luò)信息的內(nèi)部組合形式與網(wǎng)優(yōu)人員可以接受的按照既定業(yè)務邏輯形式之間的轉(zhuǎn)換。

2.2 應用層

應用層為網(wǎng)優(yōu)人員提供了自行代碼編寫、程序調(diào)試及結(jié)果展示的功能,利用JupyterHub實現(xiàn)多個網(wǎng)優(yōu)人員的Notebook管理,同時也提供了HIVE、PIG等傳統(tǒng)的大數(shù)據(jù)統(tǒng)計分析工具供網(wǎng)優(yōu)人員選擇。

2.3 分布式運算

基于Spark框架,利用Spark Streaming、Spark SQL、GraphX、MLlib等核心組件,實現(xiàn)網(wǎng)絡(luò)優(yōu)化各類型各維度數(shù)據(jù)統(tǒng)計。

2.4 分布式存儲

網(wǎng)絡(luò)優(yōu)化分析大數(shù)據(jù)平臺采用HDFS作為分布式存儲的文件系統(tǒng),HDFS有著高容錯性(fault-tolerant)的特點,而且它提供高吞吐量(high throughput)來訪問應用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應用程序。從而支持網(wǎng)優(yōu)人員在HBase[6]或HDFS上對數(shù)據(jù)進行查詢、編輯等操作。

三、應用案例

3.1 4G MR競對深度分析

本案例對超過300億條MR測量記錄進行按天各運營商覆蓋優(yōu)劣分析。首先將數(shù)據(jù)(.xml格式)采集解析清洗并轉(zhuǎn)換為parquet [7] 格式存儲到HDFS中,然后根據(jù)查重條件對數(shù)據(jù)進行聚合統(tǒng)計,得到按天的各行政區(qū)劃各場景的運營商覆蓋率、優(yōu)于競爭對手的小區(qū)數(shù)、劣于競爭對手的小區(qū)數(shù),得到覆蓋率優(yōu)于或劣于競爭對手的行政區(qū)劃數(shù)、場景數(shù),計算任務利用Spark分布式計算框架來完成,通過jupyter連接數(shù)據(jù)庫,可以對數(shù)據(jù)進行開發(fā),數(shù)據(jù)建模,最后利用Python包matpoltlib圖形化展示各運營商各行政區(qū)劃、各場景的覆蓋率、優(yōu)于或劣于競爭對手小區(qū)數(shù)的對比分析結(jié)果,支持快速定位覆蓋率差的行政區(qū)或場景,支持快速定位優(yōu)于或劣于競爭對手的行政區(qū)或場景,作為支撐后續(xù)基于覆蓋優(yōu)化的天饋調(diào)整、參數(shù)調(diào)整及網(wǎng)絡(luò)規(guī)劃工作的依據(jù)。

3.2 4G分頻段對比分析

本案例對超過30億條PM數(shù)據(jù)、超過300億條的MR測量記錄、超過1千萬條NRM數(shù)據(jù)進行按天分析。首先對數(shù)據(jù)進行數(shù)據(jù)采集解析清洗存儲到HDFS中,然后根據(jù)NRM匹配出有效的工參數(shù)據(jù),再按照工參數(shù)據(jù)中的頻段屬性進行分頻段聚合統(tǒng)計,得到按天的各頻段按頻段、按行政區(qū)劃、按場景、按基站的干擾類、接入類、保持類、容量類、移動類、負荷類、語音類、覆蓋類指標數(shù)據(jù),計算任務利用Spark分布式計算框架來完成,通過jupyter連接數(shù)據(jù)庫,可以對數(shù)據(jù)進行開發(fā),數(shù)據(jù)建模,最后利用Python包matpoltlib圖形化展示4G分頻段的各類指標,支持按指標類的不同行政區(qū)域?qū)Ρ取⒉煌瑘鼍皩Ρ龋С职葱姓^(qū)劃、按場景的不同類指標對比,支持按行政區(qū)域、按場景的某一類內(nèi)多個指標對比,作為支撐后續(xù)指標差原因分析、指標優(yōu)化分析、參數(shù)調(diào)整、負荷均衡、硬件擴減容、LICENSE調(diào)整、頻段調(diào)整、PCI調(diào)整、鄰區(qū)調(diào)整的依據(jù)。

四、結(jié)束語

基于Jupyter Notebook的網(wǎng)絡(luò)優(yōu)化大數(shù)據(jù)分析應用,構(gòu)建易于使用的網(wǎng)絡(luò)優(yōu)化分析大數(shù)據(jù)平臺,能夠快速高效為網(wǎng)優(yōu)人員提供大數(shù)據(jù)分析計算環(huán)境,解決日常網(wǎng)絡(luò)優(yōu)化的大量數(shù)據(jù)分析處理問題。同時由于網(wǎng)絡(luò)優(yōu)化分析平臺的信息安全級別要求較高,使得基于開源產(chǎn)品建設(shè)的平臺維護難度較大,需要進行有效的完全管理后才能作進一步的推廣。

參 ?考 ?文 ?獻

[1] Jupyter.The Jupyter notebook 5.4.0 documentation[EB/OL].https://jupyter-notebook.readthedocs.io/en/5.4.0/.

[2] Python. 3.9.1 documentation[EB/OL].https://docs.python.org/3/.

[3] Jupyter.JupyterHub-JupyterHub documentation [EB/OL]. https://jupyterhub.readthedocs.io/en/stable/.

[4] Hadoop A.Hadoop-Apache hadoop 3.2.2[EB/OL]. http://hadoop.apache.org/docs/r3.2.2/.

[5] S p a r k . O v e r v i e w -Documentation[EB/OL]. http://spark.apache.org/docs/latest/.

[6] Apache.Apache HBase-Apache HBase? Home [EB/OL]. https://hbase.apache.org/.

[7] Parquet.Apache parquet[EB/OL].http://parquet.apache.org/documentation/latest/.

猜你喜歡
大數(shù)據(jù)
基于在線教育的大數(shù)據(jù)研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯(lián)網(wǎng)+”農(nóng)產(chǎn)品物流業(yè)的大數(shù)據(jù)策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數(shù)據(jù)的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數(shù)據(jù)時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數(shù)據(jù)在出版業(yè)的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯(lián)網(wǎng)+”對傳統(tǒng)圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數(shù)據(jù)環(huán)境下基于移動客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
數(shù)據(jù)+輿情:南方報業(yè)創(chuàng)新轉(zhuǎn)型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 原味小视频在线www国产| 999精品色在线观看| 亚洲三级色| 亚洲三级成人| 欧美97色| 日本免费福利视频| 国产精品天干天干在线观看 | 亚洲另类第一页| 91成人免费观看| 国产精品丝袜在线| 日韩大片免费观看视频播放| 久久精品国产91久久综合麻豆自制| 亚洲天堂777| 国产精品视频白浆免费视频| 国产一在线观看| 日本高清视频在线www色| 无码人中文字幕| 国产精品久久久久久搜索| 国产爽妇精品| 乱人伦视频中文字幕在线| av在线手机播放| 四虎影视永久在线精品| 久久99国产视频| 久草热视频在线| 激情午夜婷婷| 亚洲中文字幕av无码区| 狠狠干欧美| 色一情一乱一伦一区二区三区小说 | 国产精品3p视频| 精品久久香蕉国产线看观看gif| 视频一区视频二区中文精品| 波多野结衣视频网站| 国产精女同一区二区三区久| 午夜精品区| 青青青伊人色综合久久| 91精品aⅴ无码中文字字幕蜜桃| 国产日韩精品欧美一区喷| 国模极品一区二区三区| 五月婷婷激情四射| 国产亚洲美日韩AV中文字幕无码成人| 久久毛片网| 成人午夜免费观看| 色视频国产| 国产区在线观看视频| 国产情精品嫩草影院88av| 日韩欧美中文| 色天堂无毒不卡| 五月天福利视频| 亚洲欧美成人网| 国产黄网站在线观看| 日韩精品中文字幕一区三区| 国产中文一区二区苍井空| 国产黄在线免费观看| 日韩毛片免费| 国产色婷婷| 91视频区| 免费观看欧美性一级| 91原创视频在线| 国产69精品久久久久孕妇大杂乱| 一级毛片在线直接观看| 在线免费不卡视频| 亚洲Av综合日韩精品久久久| 亚洲男人的天堂网| 孕妇高潮太爽了在线观看免费| 久久人午夜亚洲精品无码区| 在线播放91| 国产av无码日韩av无码网站| 新SSS无码手机在线观看| 日本成人不卡视频| 欧美激情视频在线观看一区| 午夜啪啪网| 精品国产成人a在线观看| 国产欧美一区二区三区视频在线观看| 欧美日韩动态图| 国产精选自拍| 久久精品一品道久久精品| 凹凸国产分类在线观看| 久久毛片网| 99这里只有精品6| 凹凸国产分类在线观看| 91精品日韩人妻无码久久| 国产午夜人做人免费视频中文|