999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于大數據的電信用戶行為分析系統的設計與實現

2020-03-04 22:17:06宋曼
科學與財富 2020年36期

宋曼

摘 要:本文基于電信大數據設計了一個移動互聯網用戶行為分析系統。該系統具備數據處理、數據統計分析、數據可視化和數據管理等多個功能,為用戶提供一站式移動互聯網用戶行為分析服務。系統提供用戶流量分群分析和用戶行為特征分析兩個場景,對用戶上網時段分布、流量特征、服務和應用偏好進行分析研究,滿足移動互聯網用戶行為數據挖掘的需要。

關鍵詞:移動互聯網;用戶行為分析;電信大數據

1. 引言

移動互聯網用戶上網過程中每分每秒都產生著大量的數據,電信運營商為用戶提供管道服務的同時也收集了移動用戶位置、上網情況、話務記錄等海量數據。通過大數據技術從海量數據中分析移動互聯網用戶上網的共性和個性特征,發現用戶流量特征、內容偏好、上網時段分布等行為習慣規律,無論是對于電信運營商有效進行網絡資源配置調優,還是對于各行各業商家實現精細化運營、提高用戶體驗,都具有十分重要的意義和價值。

2. 用戶行為分析系統需求分析

2.1 系統的總體需求

系統總體需求分以下五個步驟,數據通過處理后可以得到有價值的分析結果。具體流程如圖1所示。

2.2 系統功能需求

系統的功能需求包括用戶分群分析、用戶行為特征分析、數據挖掘計算和數據源管理四大功能模塊,系統功能結構如圖2所示。

3. 用戶行為分析系統的設計與實現

3.1 系統總體設計

系統總體采用SSH框架進行設計。底層采用HDFS+Spark組成的分布式集群,通過SSH框架處理用戶交互邏輯并對結果進行可視化展示。系統采用視圖層、控制層、服務層和數據層的分層設計模式。

1. 視圖層

視圖層通過前端界面接受用戶請求操作,將請求發往控制層。視圖層通過調用Echarts插件將結果等以柱狀圖、折線圖、餅圖等進行可視化展示。

2. 控制層

控制層負責接受來自視圖層的數據清洗、數據上傳等請求。控制層包括用戶特征分析控制模塊、用戶分群分析控制模塊、數據管理控制模塊、數據挖掘計算控制模塊。

3. 服務層

服務層負責響應控制層的請求,對請求進行處理,根據請求對相應的數據模型進行操作。服務層通過遠程調用Hadoop和Spark分布式集群的計算能力,使處理異步化。

4. 數據層

數據層負責特征數據、業務數據和數據源的存儲。特征數據和業務數據存儲在MySQL數據庫中,數據源存儲在HDFS中。業務數據庫負責存儲數據任務、腳本等系統控制信息。

3.2 數據庫設計

1. 特征數據庫設計

特征數據庫負責數據源的分布式模型、分布特征和計算結果等特征數據的存儲。主要對數據多維度多級別特征進行存儲,提高查詢效率。

2. 業務數據庫設計

業務數據庫負責用戶信息、任務狀態信息、日志信息、腳本信息等和系統控制相關數據的存儲,包含數據挖掘算法信息表、數據源信息表、挖掘任務表、參數表和數據知識流信息表。

3.3 系統核心模塊的實現

系統的核心模塊的實現主要是任務調度管理過程的實現。系統設計了任務狀態管理模塊和任務腳本管理模塊進行任務調度管理。類的設計如下:

(1)ScriptInfo:分為SparkScript和HadoopScript兩個子類。是所有分布式計算任務腳本的父類。存儲各項任務的方法以及相關的信息。

(2)SparkScript:存儲的具體信息包括集群master節點IP地址、腳本路徑、腳本類型、執行腳本的命令行等信息,是Spark腳本類,ScriptInfo類的子類。

(3)HadoopScript:該類負責實現數據在HDFS上的上傳、下載、刪除,以及獲取數據信息,是Hadoop腳本類,ScriptInfo類的子類。

(4)ScriptManage:提供對腳本信息進行增刪改查等管理,出現新的腳本時,將新的腳本信息注冊到業務數據庫中,并修改SparkScript腳本信息,是腳本管理類。

(5)JobInfo:任務類,動態存儲腳本的相關信息。當發起以該腳本為基礎的任務請求時,產生任務的概念,任務類繼承ScriptInfo中的腳本信息,包括任務的提交用戶、提交時間和完成時間、任務狀態、日志和任務結果。是ScriptInfo的子類。

(6)JobManage:任務管理類主要負責任務管理,主要是將執行的任務線程放置在Job隊列中進行管理,使任務在對應的平臺上執行。

(7)Runner:任務執行類的父類,實現Runnable方法,由該類負責創建線程執行對應任務,提供init(args)和run()兩個虛函數,實現任務執行的方法初始化和執行。

(8)FunctionRunner:Runner類的子類,是HadoopScript對應的任務執行類,執行target指向的函數,并將執行結果返回。

(9)RomoteRunner:Runner類的子類,是SparkScript對應的任務執行類,根據SparkScript中的腳本信息,通過遠程Shell命令執行對應腳本,并獲取標準輸出。

(10)ResultHandler:根據SparkScript中的Schema信息對標準輸出進行解析,將執行狀態返回,并將結果存儲到特征數據庫中。被RomoteRunner調用,對遠程Shell命令的標準輸出進行處理。

4. 總結

本文主要描述了移動互聯網用戶行為分析系統的設計與實現。首先從系統總體架構和系統動態流程兩個方面對本系統總體設計進行分解,描述了系統的分層結構以及功能實現的處理流程;然后,詳細對系統數據庫設計進行了介紹,詳細描述了特征數據庫和業務數據庫表的邏輯結構;最后,詳細描述了系統核心模塊的主要類的功能。

主站蜘蛛池模板: 亚洲精品在线91| 久热中文字幕在线观看| 免费不卡在线观看av| 亚洲精品麻豆| 国产网友愉拍精品| 国产福利大秀91| 欧美中文一区| 国产精品尤物铁牛tv| 国产精品xxx| 精品无码视频在线观看| 欧美激情成人网| 亚洲精品卡2卡3卡4卡5卡区| 日韩av无码精品专区| 亚洲中文字幕在线一区播放| 亚洲香蕉在线| 欧美日韩高清在线| 欧美a级在线| 日本免费福利视频| 2021国产v亚洲v天堂无码| 精品视频在线观看你懂的一区| 无码'专区第一页| 久久人体视频| 国产女人水多毛片18| 日韩国产另类| 久久久噜噜噜久久中文字幕色伊伊| 日本国产精品一区久久久| 91在线国内在线播放老师| 日本不卡在线视频| 欧洲熟妇精品视频| 无码一区18禁| 亚洲天堂区| 亚洲国产精品成人久久综合影院| 色有码无码视频| 日韩精品一区二区三区大桥未久| 日韩少妇激情一区二区| 国产高颜值露脸在线观看| 精品超清无码视频在线观看| 91在线丝袜| 久草网视频在线| 国产美女在线观看| 中文天堂在线视频| 国产91特黄特色A级毛片| 999国产精品| 国产女人在线视频| 国产成人精品一区二区三在线观看| 精品国产乱码久久久久久一区二区| 亚洲妓女综合网995久久 | 欧美日韩在线成人| 日本中文字幕久久网站| 成人精品免费视频| 国产爽妇精品| 热久久这里是精品6免费观看| 人妻熟妇日韩AV在线播放| 色偷偷一区| 嫩草国产在线| 国产精品七七在线播放| 成人一区在线| www.日韩三级| 国产簧片免费在线播放| 五月激情婷婷综合| 欧美性久久久久| 亚洲成人福利网站| 国产日韩欧美成人| 国产全黄a一级毛片| 精品视频免费在线| 亚洲精品制服丝袜二区| 人妻丰满熟妇av五码区| 亚国产欧美在线人成| 狠狠v日韩v欧美v| 日本在线视频免费| 国内精品视频在线| 69av免费视频| 中文字幕在线一区二区在线| 九九视频免费在线观看| 韩国v欧美v亚洲v日本v| 99久久亚洲精品影院| 亚洲水蜜桃久久综合网站| 久久精品国产91久久综合麻豆自制| 国产一区二区影院| 国产主播在线一区| 久热精品免费| 福利在线一区|