999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據驅動的互聯(lián)網時代

2014-01-14 07:41:22吳江
知識就是力量 2014年10期
關鍵詞:用戶

吳江

2014年9月的最后一周,阿里巴巴在紐約證券交易所(NYSE:BABA)正式上市,這是歷史最大規(guī)模的首次公開募股(IPO),更標志著互聯(lián)網進入了一個新的時代 ,一個屬于中國本土互聯(lián)網企業(yè)的大數據時代。

大數據的前世今生

大數據或稱海量數據,指的是所涉及的數據量規(guī)模巨大到無法通過人工,在合理時間內達到截取、管理、處理,并整理成為人類所能解讀的信息。在總數據量相同的情況下,與個別分析獨立的小型數據集相比,將各個小型數據集合并后進行分析,可得出許多額外的信息和數據關系性,可用來察覺商業(yè)趨勢,判定研究質量,避免疾病擴散,打擊犯罪或測定實時交通路況等。

大數據的定義看起來高高在上,事實上卻已經和我們的日常生活息息相關。豆瓣音樂可以通過相似用戶群體的行為推斷出每個用戶最可能喜歡哪首歌,甚至喜歡看什么樣的電影。阿迪達斯可以通過其門店銷售數據的整合分析,更準確地了解不同地域文化的消費者對其產品款式的偏好,從而更智能地決定門店的庫存?zhèn)湄洸呗浴D郴閼倬W站更是正在試圖通過引入一款能夠識別相似臉的系統(tǒng),從用戶過往的選擇數據中總結歸納用戶喜歡何種臉型,讓用戶看到的異性推薦個個喜歡。淘寶網能夠預測每個用戶可能感興趣的商品是什么,由此可以生成對于每一個用戶的個性化推薦,這也就是大家經常能看到的淘寶網側邊欄的商品推薦。通過更精確的分類商品信息的大數據分析,淘寶網更是可以回答很多一般人難以回答的有趣問題,比如18歲的群體最喜歡什么顏色的T恤,或者南方人和北方人對于運動飲料的偏好有什么不同?

簡單的用戶行為分析可能并不會產生太多的價值,而在一個極大規(guī)模上的用戶行為分析,往往可以從趨勢上得出非常有價值的預測,在商業(yè)決策上尤其如此。以我們都知道的農夫山泉礦泉水做一個例子,農夫山泉想要獲得這樣一些市場數據幫助決策:超市里怎樣擺放水堆更能促進銷售?什么年齡的消費者在水堆前停留更久?他們一次購買的量有多大?氣溫的變化讓購買行為發(fā)生了哪些改變?競爭對手的新包裝對銷售產生了怎樣的影響?這些問題看似簡單,卻很難做出有說服力的準確回答。

要回答這些問題,需要收集大量的數據。來自農夫山泉的業(yè)務員每天要來到當地超市拍攝10張照片:水怎么擺放、位置有什么變化、高度如何……一天要跑15個調研地點,每天上傳150張照片,產生的數據量約為10M,這似乎并不是個大數字。而農夫山泉在全國有10000個業(yè)務員,這樣每天的數據量就是100G,每月為3TB。雖然大家都清晰地知道,問題實時的答案就在其中,但得出答案并不容易,這就需要大數據相關的技術做支持。

大數據的數學方法和技術革新

谷歌公司(Google)曾經指出:“真正重要的不是我們可以做什么,而是我們能在什么樣的規(guī)模上做。”

如果你需要每天分析100行數據,只需要有紙和筆就可以了。如果你需要每天分析100000行數據,按照現代計算機的處理能力,你也僅僅需要一臺電腦,設計一個程序即可。但當需要處理的數據級別到了1000000000這個級別(TB級別),一臺性能強大的服務器工作站恐怕已經難以滿足你的需要了,特別是你需要實時或者接近實時的處理速度的時候。這樣的需求引領出了一個計算機與數值計算領域的熱點——分布式計算(Distributed Computing)。

分布式計算,即使用一個集群的計算機通過網絡連成系統(tǒng),把需要進行大量計算的工程數據分區(qū)成小塊,由多臺計算機分別計算,在上傳運算結果后,將結果統(tǒng)一合并得出數據結論的科學。如何將問題進行分割?如何均衡每個處理節(jié)點(即單個計算機)的工作負荷?如何高效可靠地把單個節(jié)點的結果整合成最終的結果?為了從計算機硬件和軟件上解決這些問題,多種多樣的計算模型和概念被設計出來。其中最有代表性的包括云計算、MapReduce(Hadoop)、虛擬化等等。而這股浪潮僅僅只能算剛剛開始,如同馬云所說:我們正在從信息科技時代走向數據科技時代。

海量數據與互聯(lián)網新職業(yè)

玩轉大數據,第一件重要的事情就是獲得海量的有價值的數據。而恰恰在這一點上,中國本土互聯(lián)網企業(yè)有著相當的優(yōu)勢。中國人口眾多,經濟活躍,有大量的互聯(lián)網用戶,用戶資源的豐富直接決定了用戶行為數據的豐富。淘寶網有著超過3億的注冊用戶,騰訊的注冊用戶數量早已超過10億,這些用戶數據本身無疑就是一座金礦。

阿里數據庫=40000個圖書館?

據報道,目前在阿里數據平臺事業(yè)部的服務器上,攢下了超過100PB已處理過的數據——也就是104857600GB。這相當于40000個西雅圖中央圖書館,580億本藏書。

新一代的技術必然帶動了新一代的技術人員需求。在大數據時代,“數據科學家”和“數據工程師”在硅谷已經成為最炙手可熱的工作職位之一。相比傳統(tǒng)的軟件工程師,數據科學家更像是站在數學(統(tǒng)計學)和計算機科學之間的群體,他們的日常工作既包括了軟件設計開發(fā),又包括數據建模和統(tǒng)計分析,同時還要具備將數據處理范式轉化為可行的軟件解決方案的能力。本土互聯(lián)網企業(yè)也十分重視在數據科學上的人才儲備,在可預見的將來,數據科學的從業(yè)者必將大受追捧。

(責任編輯/冷林蔚)

猜你喜歡
用戶
雅閣國內用戶交付突破300萬輛
車主之友(2022年4期)2022-08-27 00:58:26
您撥打的用戶已戀愛,請稍后再哭
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年5期)2016-11-28 09:55:15
兩新黨建新媒體用戶與全網新媒體用戶之間有何差別
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
關注用戶
商用汽車(2016年4期)2016-05-09 01:23:12
挖掘用戶需求尖端科技應用
Camera360:拍出5億用戶
100萬用戶
主站蜘蛛池模板: 91色爱欧美精品www| 亚洲人成网站色7777| 老司机午夜精品网站在线观看 | 国产一线在线| 亚洲欧美成人在线视频| 精品久久久久久中文字幕女| 毛片一级在线| 亚洲人成网站18禁动漫无码| a毛片免费看| 色成人亚洲| av在线无码浏览| 色亚洲成人| 伊人激情综合网| 色久综合在线| 久久无码高潮喷水| 伊人久久久久久久| 亚洲91在线精品| 久久久久久久久久国产精品| 国产制服丝袜无码视频| 亚洲欧美日本国产综合在线| 亚洲成a人在线观看| 亚洲伊人天堂| 国产精品久线在线观看| 全午夜免费一级毛片| 人妻丰满熟妇av五码区| 久久成人18免费| 亚洲一区第一页| 久久精品电影| 亚洲日韩图片专区第1页| 国产女人爽到高潮的免费视频 | AV无码国产在线看岛国岛| 一级一级一片免费| 97人人做人人爽香蕉精品| 香蕉久久永久视频| julia中文字幕久久亚洲| 国产丝袜无码精品| 国模极品一区二区三区| 亚洲成人在线免费观看| 在线色国产| 99在线视频精品| A级毛片无码久久精品免费| 国产中文一区a级毛片视频| 99精品这里只有精品高清视频| 国产美女丝袜高潮| 真实国产精品vr专区| 国产一区二区三区在线精品专区| 日韩一区精品视频一区二区| 亚洲色图狠狠干| 日本伊人色综合网| 国产全黄a一级毛片| 伊在人亞洲香蕉精品區| 亚洲欧美日韩另类在线一| 在线看免费无码av天堂的| 一级毛片免费不卡在线视频| 一级毛片基地| 视频二区欧美| 强奷白丝美女在线观看| 国产欧美日韩另类| 国产精品一区二区不卡的视频| 午夜丁香婷婷| 一级香蕉人体视频| 国产在线观看人成激情视频| 欧美区一区二区三| 久久青草视频| 国产成人夜色91| 日韩亚洲综合在线| 全部无卡免费的毛片在线看| 国产微拍一区| 精品国产www| 手机永久AV在线播放| 亚洲国产看片基地久久1024| 亚洲伊人电影| 热久久这里是精品6免费观看| 一区二区欧美日韩高清免费| 日韩视频免费| 国产免费久久精品99re丫丫一| 久久天天躁狠狠躁夜夜2020一| 国产精品伦视频观看免费| 日韩一区精品视频一区二区| 特级毛片免费视频| 一级毛片免费的| 97视频在线精品国自产拍|