999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據處理技術在互聯網推薦場景中的應用

2020-11-05 09:51:46董雪鵬
科學技術創新 2020年32期
關鍵詞:數據挖掘深度用戶

董雪鵬

(南京電子器件研究所,江蘇 南京210016)

在互聯網社會,每個人的線上生活都在不斷產生相應的數據,這些數據就是互聯網社會最寶貴的資源。當前互聯網公司的許多商業模式都是基于這些數據實現的。通過對互聯網用戶行為數據的處理,可以分析用戶的使用習慣,不同類別用戶的興趣特征,從而為不同用戶推送不同的內容,提升用戶使用體驗,提升應用日活用戶數量,進而提升應用商業化指標。數據處理技術在內容推薦場景的應用隨著業務場景的需求,處理技術的發展以及沉淀數據質量的提升可以分為三個方面:離線批處理,分布式流計算和深度數據挖掘。

圖1 MapReduce 結構圖

圖2 流式計算過程示意圖

1 離線批處理技術

互聯網上每天都在產生很多的數據,為了將最新的數據及時準確地送到每個用戶的眼前,需要每天對這些數據進行分析計算。比如某個線上商店新上架了一批新的熱門商品,那么電商平臺需要及時將這批商品推薦到潛在客戶的應用程序上。這里就需要進行推薦算法的計算,而且需要定期根據最新的數據進行推薦結果更新。這里存著一個核心計算問題,計算成本。

在數據量達到一定規模后,所有的計算成本都會呈指數級增長,包括內存、CPU 和時間。為了在有限的時間內盡可能快地完成計算任務(保證上架商品盡可能快地呈現到用戶面前),需要將更多的算力聯合成集群使用。同樣是由谷歌公司發表的論文“MapReduce”提供了一種解決分布式計算問題的思路,對應的開源解決方案是Hadoop 中的MapReduce 模塊(見圖1)。

MapReduce 幫助數據分析人員將存儲在分布式存儲上的海量數據分散到不同的服務器上進行并行計算,最終再將分散的計算結果進行合并得到最新的數據分析結果[1]。因為這種計算往往是面向一定規模的存量數據的,即先將數據存儲到硬盤上,當數據累積到一定的規模后再進行批量分析,因此也稱為離線批處理計算。

但是有些場景下這種計算模式是不能夠滿足我們的業務需求的。比如在導航地圖中,用戶痛點是希望知道當前道路的實時路況,如果間隔一段時間才能得到分析結果,這種體驗將會是非常糟糕的。此時數據分析的主要矛盾是計算的實效性問題,需要有一種快速的數據分析技術來支撐這種業務場景[2]。

2 分布式流計算

為了能夠提高數據分析的效率,降低數據分析時延,發展出了流計算模式[3]。流計算相比較批處理技術的核心優化點有兩個:

(1)純內存操作,節約了數據存入磁盤再進行讀取的成本。

(2)將計算分為很多小的鏈式操作,充分利用計算的流水線效應提高了計算吞吐能力。

流式計算開源的解決方案有很多,當前業界最流行的解決方案是Apache 基金會開源的Flink 實現(如圖2)。

流計算過程中,數據像流水線一樣闖過由Operator 組成的處理鏈條,整個數據集的平均吞吐延時約等于Operator 中耗時最長節點的延時[4]。

3 深度數據挖掘

隨著批處理和流處理場景的落地,這些大數據處理技術滿足了各種用戶最基本的需求,但是互聯網沉淀的數據資源的價值還遠遠沒有被挖掘出來。為了滿足不同用戶個性化的需求,實現千人千面的業務價值,需要引入一些更高階的計算模式,這就是深度學習技術[5]。

深度學習技術的應用是工程、算法和商業模式在一個合適的時間點發生碰撞的結果,通過前面的工程積累,生產上基本解決了大規模復雜計算的問題。此外,2010 年之后深度學習算法的飛速發展也為商業應用提供了強有力的理論支撐,還有多年來各個應用場景沉淀下來的海量的優質標定數據,也為技術的商業化應用提供了保障。在這樣一個特定的時間點,數據,算法和工程碰撞在一起成就了數據挖掘的成功應用。

4 結論

大數據技術在互聯網領域的成功應用有著清晰的發展脈絡。本質上由于互聯網的普及造成了海量數據噴發,而實際生產的需要推動了工程和算法各個方面協同發展,最終達到完美的融合,實現了商業上的成功。這一發展過程,在其他行業引入大數據技術進行生產時,值得充分借鑒。

猜你喜歡
數據挖掘深度用戶
探討人工智能與數據挖掘發展趨勢
深度理解一元一次方程
深度觀察
深度觀察
深度觀察
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
一種基于Hadoop的大數據挖掘云服務及應用
主站蜘蛛池模板: 欧美激情第一区| 美女无遮挡拍拍拍免费视频| 国产色婷婷视频在线观看| 五月婷婷导航| 成人免费黄色小视频| 亚洲第一页在线观看| 日韩精品高清自在线| 国产成人精品视频一区二区电影| 日韩欧美中文字幕在线韩免费| 久久福利网| 免费国产不卡午夜福在线观看| 狠狠干综合| 免费A∨中文乱码专区| 露脸一二三区国语对白| 国产午夜不卡| 日韩中文无码av超清| 亚洲人成色在线观看| a毛片免费在线观看| 欧美午夜久久| 国产人碰人摸人爱免费视频| 国产青榴视频在线观看网站| 播五月综合| yjizz视频最新网站在线| 国产无码精品在线| 一级毛片不卡片免费观看| 天天爽免费视频| 一级毛片在线播放免费观看| 国产精品无码作爱| 亚洲AV无码久久精品色欲| 国产偷国产偷在线高清| 国产精品久久自在自线观看| 四虎亚洲精品| 欧美综合区自拍亚洲综合绿色| 2020久久国产综合精品swag| 日韩国产黄色网站| 日韩美毛片| 欧美成人精品在线| 亚洲欧州色色免费AV| 亚洲天堂伊人| 久久这里只有精品2| 免费看美女自慰的网站| 制服丝袜在线视频香蕉| 亚洲综合九九| 五月激激激综合网色播免费| 成人亚洲天堂| 久久婷婷六月| 91娇喘视频| 国产十八禁在线观看免费| 日本欧美午夜| 在线永久免费观看的毛片| 国产欧美日韩专区发布| 国产精品视频3p| 亚洲国产日韩视频观看| 在线亚洲精品自拍| 国产综合另类小说色区色噜噜| 日本黄色a视频| 国产打屁股免费区网站| 日本成人不卡视频| 亚洲欧美另类日本| 色综合国产| 国产一线在线| 国产欧美日韩精品第二区| 福利视频99| 日韩黄色在线| 伊人精品视频免费在线| 亚洲天堂视频网| 四虎精品国产永久在线观看| 国产成人高精品免费视频| 波多野结衣中文字幕一区| 91在线免费公开视频| 青青草原偷拍视频| 乱系列中文字幕在线视频| 亚洲成人在线免费观看| 亚洲av综合网| 亚洲欧美日韩成人在线| 亚洲va欧美ⅴa国产va影院| 国产一级在线播放| 99草精品视频| 亚洲小视频网站| 超清无码一区二区三区| 99草精品视频| 国产农村精品一级毛片视频|