999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hue 的自動化數據分析系統設計與實現

2021-03-24 08:22:02王帥萬小霞
現代計算機 2021年3期
關鍵詞:用戶系統

王帥,萬小霞

(鹽城師范學院信息工程學院,鹽城224002)

0 引言

淘寶、京東以及世界各地的大型商場和連鎖門店,每日都有大量的交易清單產生,一個購物狂歡節就有過億交易金額要處理。快遞、物流每天也有各種數據產生如國內外物流清單、發貨退貨記錄等,醫院、診所也有藥物清單、病人資料、就診記錄等,就連日常聊天一段時間下來也是篇幅巨大。騰訊的數據中心內有大量的會話信息,基于這些數據進行新型應用開發。總之,這些數據不可避免地成為了一個新平臺,大數據時代要求我們在以數據為中心的平臺上進行分析并去開發新型數據管理系統和相應的應用系統[1]。

1 系統分析

大數據分析平臺由商城系統和數據可視化系統組成。具體來說,商城系統有離線日志發送、實時數據轉發兩大功能;數據可視化系統具有用戶總人數及活躍度統計、熱銷商品分析、廣告實時點擊量以及地域分布統計等功能。

1.1 商城系統

(1)離線日志發送

將商城的離線數據發送給Flume 日志系統并在本地備份

(2)實時數據發送

將商城的實時數據發送給Kafka 消息管理中心。

1.2 數據可視化系統

(1)用戶統計

表格展示商城用戶總人數、新增用戶人數、昨日活躍度、昨日活躍率。

(2)標簽點擊量TOP5

環狀圖展示點擊數量最多的前5 個分類。

(3)商品點擊量TOP5

半環狀圖展示點擊數量最多的前5 個商品。

(4)熱銷商品TOP5

環狀圖展示購買數量最多的前5 個商品。

(5)收藏商品TOP5

柱狀圖展示加入購物車數量最多的前5 個商品。

(6)廣告實時點擊量

折線圖展示當天各時段的廣告點擊量

(7)銷售區域分布

中國地圖展示各區域銷售情況

1.3 Hadoop服務器

(1)離線日志分析

Flume 日志系統接收離線日志,使用Hive 數據倉庫存儲數據,Spark SQL 處理離線數據

(2)實時數據轉發

2 系統設計

2.1 商城系統設計

商城系統重點是整合獲取離線和實時數據兩部分功能,具體實施應與對應上線系統對接,本次使用的商城系統為簡易設計的模擬系統,目的是保證大數據分析平臺的數據來源真實可靠。

本系統主要配置兩大模塊,離線日志發送,實時數據發送。

(1)離線日志發送模塊

首先商城中的離線數據發送至Linux 服務器中的Flume 日志系統,及那根離線數據日志存在服務器上,而后將日志上傳至HDFS 分布式文件管理系統并按格式導入Hive 數據倉庫,再運行編寫好的Spark SQL 和Spark ALS 的JAR 包,將Hive 數據倉庫中的數據提取分析并將結果寫入MySQL 數據庫中。

離線日志發送模塊的流程如圖1 所示。

圖1 離線日志發送模塊流程圖

(2)實時數據發送模塊:

實時數據則由商城系統直接發送給Kafka 消息中心,將Kafka 消息中心作為中轉站,把實時數據轉發給已經啟動好的Spark Streaming 服務,Spark Streaming 就會按照時間滑窗將數據按小時分組存入MySQL 數據庫中。

2.2 數據庫設計

本系統將設計1 個MySQL 數據庫。數據庫名為shop,數據庫中包含的數據庫表有:

addCar 表:存儲加入購物車匯總信息;

buyGoods 表:存儲購買商品匯總信息;

clickAd 表:記存儲廣告實時點擊匯總信息;

clickGood 表:存儲瀏覽商品匯總信息;

clickTab 表:存儲瀏覽分類匯總信息;

hotGoods 表:存儲銷售區域分布匯總信息;

userStatistics 表:存儲各用戶統計信息;

recommend 表:存儲所有用戶的推薦商品信息。

其中最主要的是推薦表,是推薦算法的直觀展示,表1 給出商品推薦表的詳細設計。

表1 商品推薦表

3 系統實現

3.1 離線數據處理模塊

離線數據處理分為3 步:商城發送日志,過濾日志,導入數據倉并分析。

(1)商城發送日志

商城整合日志組件,配置Logback 配置文件。

以上代碼為Logback 詳細配置,一共兩塊日志采集的功能。fileAppender 的功能為本地備份,日志信息記錄為log 格式的文件,每5MB 生成以一個記錄文件,以時間格式命名。Flume 的功能為發送日志的功能,與Flume 建立連接后,追條發送日志給Flume。每當使用INFO 級別的日志功能就會觸發這兩個功能,將日志本地備份并且發送給Flume 日志系統,如圖2 所示。

圖2 后端日志圖

(2)過濾日志

配置Flume 啟動配置文件,編寫Shell 腳本。

以上代碼為Flume 詳細配置,通過此配置啟動Flume 日志系統,每當接收到日志數據時,按照攔截格式保留需求數據,存于本地shop 目錄下的logs 文件夾內。

以上代碼為Shell 腳本中的部分功能,目的是將logs 文件夾中的昨日數據,剪切到臨時文件夾logsmv,通過HDFS 命令將歷史文件夾中的日志上傳到HDFS文件管理系統,最后清空臨時文件夾。使用臨時文件夾logsmv 的目的是因為在命令執行期間可能會有新的日志進來,清空數據的時候會產生誤刪的情況。

(3)導入數據倉并分析

啟動Hive 和Spark 服務,執行Spark SQL 的JAR 包。

以上代碼為Spark SQL 詳細功能,使用Scala 語言開發。先將HDFS 文件系統中的日志導入Hive 數據倉庫中內,再將日志數據分類分析,最后將結果存入MySQL 數據庫,便于查詢。

3.2 實時數據處理模塊

實時數據處理分為3 步:商城發送消息、消息中轉、實時分析數據。

(1)商城發送消息

為商城整合消息組件,與Kafka 建立會話。

以上代碼為商城將廣告點擊的消息發送給Kafka的實現代碼,通過配置的參數將消息發送到指定IP 和端口的Kafka。

(2)消息中轉

將Kafka 作為消息中轉站。

以上代碼為啟動Kafka 服務并開啟shop 會話。

(3)實時分析數據

數據可視化模塊獲取消息,分析實時數據。

以上代碼為Spark Streaming 獲取Kafka 的消息,而后將計算每個小時的各個廣告點擊量并存入MySQL。

3.3 數據可視化模塊

本功能模塊為前后端分離項目,前臺使用VUE 框架,后臺使用Spring Boot 搭建的SSM 框架,界面效果如圖3 所示。

圖3 數據可視化界面

3.4 商品推薦模塊

本功能模塊為離線分析拓展模塊,通過算法實現數據分析進階功能,即針對每一位用戶,為其推薦滿足其喜好的商品,讓平臺具有智能化。

(1)ALS 推薦算法

本模塊使用的技術是Spark MLlib,基于Spark ML?lib 實現的ALS 推薦算法。

以上代碼為商品推薦的具體實現。ALS 是交替最小二乘(Alternating Least Squares)的簡稱。在機器學習中,ALS 特指使用交替最小二乘求解的一個協同過濾推薦算法。它通過將用戶的瀏覽、收藏和購買行為進行打分,將用戶與商品之間缺失的評分補齊,以評分為依據來推斷每個用戶的愛好并向用戶推薦適合的產品。

(2)RMSE 算法調優

ALS 推薦算法訓練過程中存在擬合問題,擬合問題有兩種,欠擬合和過擬合,都會影響結果的精準度。欠擬合就是擬合精度不夠,舉個例子,數據集是個第一象限的冪函數,而我們得到的結果卻是個一次函數直線,雖然也接近目標,但是誤差還是比較大。過擬合是指精度要求過高,過分考慮到每一個數據點,使得原本很完美的結果曲線變形。在科學研究過程中,對于異常數據的排除和忽略是至關重要的環節。在算法調優時,可以通過RMSE 均方根誤差判斷擬合參數是否合理。

以上代碼為算法調優的具體實現,代碼對評分矩陣進行分解,隱特征數量設置為10,迭代10 次,正則化參數設為了0.01。將真實評分數據集與預測評分數據集合并,可以得到用戶對每一個商品的實際評分和預測評分,然后計算評分的根均方差,以誤差值為依據,調整參數進行調優。

4 結語

本次大數據分析平臺的重要核心功能就是數據的分析模塊,分析中針對不同需求場景,對應著不同的算法。在對算法的研究過程中,了解到聚類、分類、推薦、決策樹等高階算法,更加加深了對普通算法的理解,即使使用尋常算法,許多難題也都迎刃而解。繼大數據學習之后,學習算法接觸人工智能也是主流方向,用大規模數據訓練模型,可以給后續學習打下基礎。

猜你喜歡
用戶系統
Smartflower POP 一體式光伏系統
工業設計(2022年8期)2022-09-09 07:43:20
WJ-700無人機系統
ZC系列無人機遙感系統
北京測繪(2020年12期)2020-12-29 01:33:58
基于PowerPC+FPGA顯示系統
半沸制皂系統(下)
連通與提升系統的最后一塊拼圖 Audiolab 傲立 M-DAC mini
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
主站蜘蛛池模板: 99在线视频免费观看| 国产九九精品视频| 国产日韩欧美在线播放| 久久一级电影| 午夜三级在线| 一级爱做片免费观看久久| 视频一区视频二区中文精品| 国产人人射| 99热国产在线精品99| 无码国产伊人| 国产成人午夜福利免费无码r| 一本大道香蕉高清久久| 午夜国产大片免费观看| 91精品国产丝袜| a在线亚洲男人的天堂试看| 欧美一级黄片一区2区| 国产主播福利在线观看| 国产白浆在线| 亚洲系列无码专区偷窥无码| 无码高潮喷水专区久久| 四虎成人精品| 日韩欧美中文字幕在线韩免费| 欧洲亚洲一区| 国产高颜值露脸在线观看| 91蝌蚪视频在线观看| 鲁鲁鲁爽爽爽在线视频观看| 视频二区国产精品职场同事| 亚洲国产综合精品一区| 亚洲首页在线观看| 国产在线精品美女观看| 大陆精大陆国产国语精品1024| 亚洲精品国产综合99| 亚洲视频二| 欧美日韩v| 国产亚洲精品自在线| 少妇精品久久久一区二区三区| 欧美精品啪啪| 国产激情影院| 永久天堂网Av| 国产超薄肉色丝袜网站| 97久久超碰极品视觉盛宴| 日本爱爱精品一区二区| 18禁黄无遮挡网站| 亚洲欧美精品一中文字幕| 伊在人亚洲香蕉精品播放| 天天操天天噜| 福利小视频在线播放| 欧美成人区| 日韩成人午夜| 日韩精品一区二区三区免费在线观看| 中文无码影院| 99视频在线免费观看| 欧美中文一区| 免费一级α片在线观看| 欧美97欧美综合色伦图| 亚洲日本www| 国产亚洲高清视频| 国产电话自拍伊人| 无码丝袜人妻| 亚洲精品国产成人7777| 日韩区欧美国产区在线观看| 亚洲第一色视频| 亚洲国产亚综合在线区| 尤物特级无码毛片免费| 午夜免费小视频| 婷婷成人综合| 国产成人91精品免费网址在线| 亚洲人成人伊人成综合网无码| 欧美人与动牲交a欧美精品| 青青久在线视频免费观看| 国产黄在线观看| 亚洲视频a| 蝌蚪国产精品视频第一页| 97人人做人人爽香蕉精品| 亚洲天堂网视频| 免费Aⅴ片在线观看蜜芽Tⅴ| 国产精品视频白浆免费视频| 98超碰在线观看| 亚洲欧美日韩色图| 欧美日韩久久综合| 中国一级毛片免费观看| 看国产一级毛片|