999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Hadoop 的大數據運營系統

2021-07-16 10:07:26高海超常祎雯楊文峰馮學偉
科學技術創新 2021年19期
關鍵詞:用戶分析

高海超 常祎雯 楊文峰 馮學偉 鄧 哲 白 濤

(延安大學 數學與計算機科學學院,陜西 延安 716000)

1 概述

當下正處于大數據時代,用戶在網絡中的各種操作都會留下數據,數據背后的價值性毋庸置疑。各行各業對挖掘數據價值的需求日益劇增。對于電商企業來說,用戶的點擊、分享、加購物車、收藏、購買等歷史數據可以對電商企業的發展和規劃起到極大地指導作用,能夠提高用戶黏度,增強用戶購物體驗,幫助企業實現更好的運營效果。

為了更好的利用數據背后的價值,可利用計算機對歷史數據進行分析。由于數據龐大,需要算力極高。可考慮采用分布式計算,以PC 機集群來對大數據進行處理,來彌補小型企業計算機性能低下的問題。同時采用分布式存儲,還能更好的對數據進行存儲及備份,提高系統容錯性。

為使用戶在購物時,能夠得到系統推薦的,更貼合用戶需求的商品。則需要對用戶的過往操作數據進行分析,通過歷史數據得出規律,并為用戶推薦合適的商品是大數據運營系統最重要的目的。本文以商品推薦為例,通過Hadoop 分布式大數據處理框架,對銷售數據以及用戶行為數據進行清洗及分析,同時還使用Spark 提供的機器學習庫中的多種算法來訓練模型,并通過模型計算得到推薦值。使得用戶在購物時,能夠從多種維度收到來自平臺的個性化推薦。以實現增強用戶的購物體驗,提高用戶黏度,進而增大平臺銷售量。

2 分布式存儲

由于本項目需要根據大量歷史數據進行分析,才能得到更好的推薦結果,面對大規模數據,采用分布式的存儲是非常有必要的。Hadoop 提供的HDFS(Hadoop distributed file system)就是一個分布式文件系統,如圖1 所示。

圖1 HDFS 結構圖

將文件默認按128M分為多個block,進而存儲在多個Data Node 節點上,每個block 默認保存3 個備份。

3 數據清洗

數據清洗部分主要依賴于Hadoop 下的MapReduce 來進行,本項目編程語言使用Java,在開發過程中,可直接用Java 調用Hadoop 接口,覆寫map 和reduce 方法,根據實際數據及需求,來對數據進行清洗和補償。

3.1 去重

在數據處理過程中,發現存在一些操作數據產生時間相同,分析是系統運行過程中被惡意訪問,或者存在刷點擊量的行為,而這些行為數據對實際數據分析毫無用處,故需要對其進行清除,這里考慮使用MapReduce 將完全相同數據只讀取其中一個,將其它的無用數據進行清除,以達到去重目的。

3.2 IP 地址補償

由于需要按地域區分用戶,并按地域進行分析,故要對IP地址進行補償。將一串IP 地址其視為256 進制數,然后將其轉為整型數,將其視為地址最大數,進而在0 和最大數中間隨機生成1 個數,再通過位運算,將其轉為IP 地址格式,即可得出隨機IP 地址。

4 數據分析

根據用戶登陸與操作情況進行分析,設用戶操作分別為瀏覽、收藏、加購、付款四種類型,分別賦值1-4 分可得用戶評分向量。

4.1 活躍用戶記錄

活躍用戶記錄可利用位圖來實現,以1 作為登錄,0 作為登錄,以此來記錄用戶的具體登錄情況。以此方法,可以將一個月的數據合并為一條數據,這樣可以極大的減少數據的空間占用,同時實現對用戶活躍度的記錄。

4.2 基于協同過濾的商品推薦

基于用戶的協同過濾,通過不同用戶對物品的評分來評測用戶之間的相似性,基于用戶之間的相似性做出推薦,如圖2 所示。

圖2 對相似用戶的物品推薦

為實現以上算法,引入Co-occurrence Matrix(同現矩陣)與User Preference Vector(用戶評分向量),以同現矩陣與用戶評分向量相乘得到Recommended Vector(推薦向量)。最后按照排序高低對用戶進行推薦,如圖3 所示。

圖3 基于協同過濾的商品推薦算法示意圖

4.3 ALS(交替最小二乘法)

直接調用Spark 的Mllib 庫中的算法實現。將用戶對商品的評分矩陣分解為2 個矩陣分別設為X 與Y。

隨機生成X,Y,固定Y,使用公式3 更新Xu,固定X,使用公式(4)更新Yi,重復交替執行公式(3)和公式(4),直到均方根誤差RMSE 收斂。ALS 算法流程圖如圖4 所示。

圖4 ALS 算法流程圖

5 結論

以HDFS 作為存儲系統,借助kafka 與flume 對數據進行采集,之后調用Spark 的Mllib,使用位圖、同現矩陣、ALS(交替最小二乘法)等算法實現了對數據進行處理與分析,并得到推薦結果。對提升用戶體驗與增強用戶黏性,做出了巨大的幫助。

猜你喜歡
用戶分析
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
電力系統及其自動化發展趨勢分析
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
Camera360:拍出5億用戶
創業家(2015年10期)2015-02-27 07:55:08
100萬用戶
創業家(2015年10期)2015-02-27 07:54:39
如何獲取一億海外用戶
創業家(2015年5期)2015-02-27 07:53:25
中西醫結合治療抑郁癥100例分析
主站蜘蛛池模板: 日韩欧美高清视频| 在线观看精品自拍视频| 日本影院一区| 国产成人艳妇AA视频在线| 亚洲最猛黑人xxxx黑人猛交| 亚洲激情区| 国产成人精品日本亚洲77美色| 亚洲成aⅴ人片在线影院八| 欧美一级夜夜爽| 波多野结衣中文字幕久久| 久久综合AV免费观看| AV老司机AV天堂| 亚洲第一成年人网站| 亚洲人成电影在线播放| 亚洲高清国产拍精品26u| 色有码无码视频| 97se亚洲综合不卡| 国产00高中生在线播放| 中文字幕第4页| 国产精品99一区不卡| 亚洲色图欧美在线| 国产免费高清无需播放器| 亚洲人成网站色7799在线播放| 国产成人综合在线观看| 欧美自拍另类欧美综合图区| 国产精品永久在线| 国产91丝袜在线播放动漫| 亚洲日本在线免费观看| 国产乱视频网站| 精品精品国产高清A毛片| 亚洲欧美在线综合图区| 日本91视频| 亚洲女同一区二区| 欧美日韩va| 免费国产高清精品一区在线| 幺女国产一级毛片| 亚洲成人动漫在线观看| 亚洲精品桃花岛av在线| 国产激情在线视频| 三区在线视频| 一级不卡毛片| 国产成人精品亚洲77美色| 日韩中文欧美| 亚洲美女一级毛片| 看av免费毛片手机播放| 国产高清国内精品福利| 亚洲Av激情网五月天| 中文国产成人久久精品小说| 国产91丝袜| 国产不卡国语在线| 无码在线激情片| 免费网站成人亚洲| 亚洲欧美成人| 国产制服丝袜91在线| 青青草综合网| 欧美综合成人| 中文字幕乱码中文乱码51精品| 97国产精品视频人人做人人爱| 尤物视频一区| 国产精品美乳| 免费一级毛片| www.youjizz.com久久| 波多野结衣爽到高潮漏水大喷| 亚洲人成亚洲精品| 老司机aⅴ在线精品导航| 在线观看无码av免费不卡网站| 国产精品密蕾丝视频| 国产成人a在线观看视频| 亚洲精品手机在线| 丰满人妻被猛烈进入无码| 最新国产午夜精品视频成人| 国产成人1024精品| 日本国产精品| 久久国产V一级毛多内射| 伊人无码视屏| 久久久久88色偷偷| 亚洲视频二| 亚洲黄网在线| 福利国产在线| 亚卅精品无码久久毛片乌克兰| 一级毛片基地| 伊人久久影视|