999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

MapReduce文本分析技術在商業模式中的應用

2019-09-10 07:22:44李明杰劉小飛
現代信息科技 2019年13期
關鍵詞:數據分析

李明杰 劉小飛

摘 ?要:大數據技術的迅猛發展帶來商業運行模式的巨變,這種改變正從云端潛移默化地滲透到每一個置身其中的消費者身上。從數據分析的角度去處理和解決問題,用大量數據分析得出的結論是最有效、最科學的,這一觀點正逐步被所有人接受。本文將從實際案例出發,描述現有大數據商業分析模式,并展示其中最常用的MapReduce文本分析技術。

關鍵詞:用戶追蹤;數據分析;MapReduce

中圖分類號:TP391.1 ? ? ?文獻標識碼:A 文章編號:2096-4706(2019)13-0013-03

Application of MapReduce Text Analysis Technology in Business Model

LI Mingjie,LIU Xiaofei

(School of Information & Intelligence Engineering,University of Sanya,Sanya ?572022,China)

Abstract:The rapid development of big data technology has brought about tremendous changes in business operation mode,which is imperceptibly penetrating into every consumer in the cloud. From the perspective of data analysis to deal with problems and solve problems,a large number of data analysis concluded that the most effective and scientific,this view is gradually accepted by all. In this paper,we will describe the existing business analysis model of large data based on practical cases,and show the most commonly used MapReduce text analysis technology.

Keywords:user tracking;data analysis;MapReduce

0 ?引 ?言

大數據的發展帶來了商業模式的改變,其技術的不斷進步帶來了前所未有的商機。大數據技術可以使得商業公司提升現有數據庫的性能,使其更現代化;對于目前存在的機會,更具有洞察力;更快速地獲取信息,探索并利用新的機會。下面我們介紹兩種常見的商業應用。

1 ?問題的提出

第一種應用是面向廣告公司的,或者是有投放廣告訴求的公司,他們希望可以使用大數據技術在線上接觸到特定的目標群體并且能在網絡上追蹤目標消費者。第二種應用我們以亞馬遜為例,分析如何使用大數據來增加銷量,并幫助其針對各類消費者提供個性化的產品和服務。

2 ?基于大數據背景的解題思路

針對第一種應用,我們給出這樣一種思路:若使得廣告公司或者公司可以使用大數據在線上接觸到特定的目標群體并且能在網絡上追蹤目標消費者,其實質就是利用大數據分析得出18歲-25歲這部分人群最經常瀏覽的網站平臺以及瀏覽時間,以此指導廣告公司的最佳廣告投放位置和投放時間。具體實施步驟如下:

(1)首先是數據收集階段,可考慮在網絡主流社交平臺上投放廣告,比如國內的QQ、國外的Facebook、Twitter等等。在沒有任何先驗知識的情況下,這時期各平臺的投放比例和投放時間應平均且一致。經過一段時間的投放后,通過對點擊廣告并下單的實際消費者進行追蹤,對其在社交平臺上的瀏覽痕跡,比如發表的評論或點贊等信息進行收集和整理,得出消費者的分布情況,并重點對18歲-25歲這個年齡段的群體進行進一步分析,得出他們感興趣的方面,比如提及“歐冠”“NBA”等詞匯的比例達到70%,提及“游戲”“疲勞”等詞匯的達到20%,其他有10%。則可以進一步追蹤目標消費者。

(2)改進階段。一是根據收集分析得出的各大社交平臺上的實際點擊頻率和點擊時間,改變各平臺的投放比例和投放時間;二是根據分析得出的關鍵詞匯對目標消費者進行追蹤投放,比如70%都提及了體育類詞匯,則可以在QQ的體育專欄或NBA專欄中投放廣告,并且在廣告語中加入“運動”“無極限”類的關鍵詞。

針對第二種亞馬遜的服務需求,則需兼顧大眾營銷和個性營銷之間的平衡。一是大眾營銷,即利用自身平臺和公共社交平臺收集的數據分析,重點改善亞馬遜平臺自身的品牌形象,產品推薦和價格設定等;二是優質消費者的定制化個性營銷,即注冊會員服務等等,追蹤會員人群的消費特點,針對性的定制服務。具體實施步驟如下:

(1)增加銷量的一個簡單方法是根據亞馬遜網站上的搜索關鍵詞,進行數據分析,得出關鍵詞的搜索頻率,在網站主頁醒目位置提供這些關鍵詞對應消費品的展示,增加點擊量。除此之外,在各大社交網站平臺,搜索關于亞馬遜產品和服務的評價,通過分析,完善自身服務水平,并使得產品有更加明確的消費群體指向。

(2)設置商品的普通價格和會員價格,使得更多人從普通消費者轉變為會員消費者,這樣亞馬遜可以獲得更多關于該消費者的個人信息(比如:email、手機號碼等),也更有利于追蹤該消費者的消費習慣。根據大量的消費者的消費數據,分析得出不同的消費者類型,比如A類型的消費者每次買完兒童讀物之后還會去瀏覽女性化妝品,可以據此為這類用戶設定好相應產品的鏈接,讓其在購買兒童讀物的時候,方便地跳轉到化妝品頁面。而且這樣分解成不同的消費者類型后,當有類似購買行為的消費者出現的時候,系統也可以將其歸類到某種消費類型中,以便為其提供更好的服務,而原本屬于類型A的消費者如果購買習慣發生了變化,通過數據分析后,要迅速更新他的消費類型,將其歸為更符合他現在消費習慣的類型中。

以上即是在大數據背景下常見的兩種商業思維模式,這其中數據分析扮演著非常重要的角色,而利用MapReduce進行文本分析是其中最常用的技術手段。

3 ?MapReduce基礎

隨著網絡用戶的急劇增加,原有的網頁爬取和頻率查詢類應用無法應對未來的需求。為了可以高速地處理大量數據,商業公司開始使用網絡中集群形式的分布計算機。分布式新算法要求必須與數據的位置以及處理數據的應用程序的位置無關。為了實現這一算法,一種新的泛型編程模型誕生了,這就是MapReduce。MapReduce這個名字來源于兩種已存在的編程語言功能的結合,也就是Map和Reduce。

MapReduce具有如下特性:

(1)時序安排。將一項工作分割為各個單獨的任務,再由應用程序的Map和Reduce來進行處理。

(2)同步。通過保持追蹤任務及時來同時執行多個進程。

(3)代碼數據協同定位。在執行相關進程和處理相關數據之前,把代碼和與其相關的數據放到同一個節點上。

(4)錯誤處理。在一個Hadoop集群中,可以跨節點來有效地處理錯誤。

要讓MapReduce高效地工作需要一個合適的算法:從大量的數據或者記錄開始,對數據進行迭代,利用Map功能提取有效信息并且創建一個輸出列表,整理輸出列表進行優化以便后續處理,利用Reduce功能來計算一系列的結果,產生最終的輸出。

4 ?MapReduce文本分析

對于各種形式的文本分析而言,LineCount應用程序是一個不可或缺的統計工具。想分析文本,我們必須知道文本中的行數、字數和單詞數。此外,這些參數的出現頻率也有助于我們對數(值)進行分類。本文實驗中,我們將借助Eclipse集成開發環境(IDE)編寫MapReduce程序,以統計給定文本文件的行數。下面給出具體實驗步驟:

(1)在Ubuntu上安裝Eclipse、Hadoop和JDK,在Eclipse中創建新的Java Project,在其中添加必要的jar包文件,如圖1所示。

(2)創建包,并在包中創建“LineCount”類,其核心代碼如圖2所示。

(3)將LineCount項目導出為jar文件。啟動Hadoop,復制所要分析的文件(文件名為loaddata1)到HDFS,重命名為LOAD,如圖3所示。

(4)運行MapReduce程序,如圖4所示。

(5)最后將結果導出到文本文件并查看,如圖5所示。

5 ?結 ?論

在大數據背景下,我們需要轉變自身思維,從數據分析的角度去處理問題和解決問題,認同大量數據分析得出結論的有效性和科學性。掌握大數據分析的常用技術,體會大數據背景下的商業模式變革。

參考文獻:

[1] 王永昌,朱立谷.面向Twitter情感分析的文本預處理方法研究 [J].中國傳媒大學學報(自然科學版),2019,26(2):31-38.

[2] 冒佳明,王鵬飛,趙然.MapReduce架構下Reduce任務的調度優化 [J].無線互聯科技,2018,15(22):5-6.

[3] 陳先紅,宋發枝.互聯網新技術背景下的輿論傳播策略 [J].武漢理工大學學報(社會科學版),2019(3):1-6.

作者簡介:李明杰(1984-),男,漢族,吉林松原人,碩

士,副教授,研究方向:模式分析與人工智能;劉小飛(1984-),女,漢族,吉林敦化人,碩士,副教授,研究方向:動態規劃與規劃識別。

猜你喜歡
數據分析
電子物證檢驗的數據分析與信息應用研究
基于matlab曲線擬合的數據預測分析
商情(2016年40期)2016-11-28 11:28:07
分眾媒體趨勢下場景營銷的商業前景
商(2016年32期)2016-11-24 17:39:41
佛山某給水管線控制測量探討
科技資訊(2016年18期)2016-11-15 18:05:53
SPSS在環境地球化學中的應用
考試周刊(2016年84期)2016-11-11 23:57:34
大數據時代高校數據管理的思考
科技視界(2016年18期)2016-11-03 22:51:40
我校如何利用體育大課間活動解決男生引體向上這個薄弱環節
體育時空(2016年8期)2016-10-25 18:02:39
Excel電子表格在財務日常工作中的應用
淺析大數據時代背景下的市場營銷策略
新常態下集團公司內部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
主站蜘蛛池模板: 国产精品亚洲一区二区三区z | 精品国产免费人成在线观看| 无码网站免费观看| 久久免费精品琪琪| 久久精品只有这里有| 久久亚洲黄色视频| 亚洲狼网站狼狼鲁亚洲下载| 蜜芽一区二区国产精品| 国产精品成人AⅤ在线一二三四| 一本大道香蕉久中文在线播放| 日韩精品一区二区三区swag| 欧美日韩在线亚洲国产人| 国产人人干| 美美女高清毛片视频免费观看| 色爽网免费视频| 狼友视频国产精品首页| 亚洲精品免费网站| 韩国v欧美v亚洲v日本v| 国产一区成人| 妇女自拍偷自拍亚洲精品| 九九久久精品免费观看| 97在线公开视频| 91精品啪在线观看国产60岁| 国产拍在线| 国产日韩精品欧美一区喷| 日韩精品高清自在线| 内射人妻无套中出无码| 91无码视频在线观看| 波多野结衣一区二区三区88| 亚洲一区网站| 内射人妻无套中出无码| 国产乱人免费视频| 国产成人a在线观看视频| 天天干天天色综合网| 免费看一级毛片波多结衣| 亚洲精品国产自在现线最新| 一本无码在线观看| 91精品网站| 日韩欧美国产精品| 日韩123欧美字幕| 久久青草精品一区二区三区| 欧美日韩中文国产| 激情综合图区| 日本黄色a视频| 亚洲无码在线午夜电影| 欧美日本中文| 青青青国产在线播放| 国产午夜精品鲁丝片| 欧美色丁香| 亚洲AV无码久久精品色欲| 亚洲精品第一在线观看视频| 欧美天堂在线| 国产一级毛片yw| 国产偷国产偷在线高清| 国产免费黄| 色综合天天操| 欧美在线中文字幕| 亚洲天堂久久新| 国产青榴视频| 精品中文字幕一区在线| 亚洲成人在线网| 青草精品视频| 暴力调教一区二区三区| 亚洲一区二区约美女探花| 一本一本大道香蕉久在线播放| 欧美va亚洲va香蕉在线| 88av在线播放| 女人一级毛片| 久久 午夜福利 张柏芝| 在线日韩日本国产亚洲| P尤物久久99国产综合精品| 91在线播放免费不卡无毒| 国产一级一级毛片永久| 在线a网站| 激情视频综合网| 中国成人在线视频| 亚洲人成影院在线观看| 啦啦啦网站在线观看a毛片| 国产精品视频3p| 伊人网址在线| 四虎免费视频网站| 在线观看亚洲天堂|