999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

當談論大數據時,我們談些什么

2012-04-29 00:44:03孫泠
IT經理世界 2012年20期

孫泠

“大數據”的經典定義是可以歸納為4個V:海量的數據規模(volume)、快速的數據流轉和動態的數據體系(velocity)、多樣的數據類型(variety)和巨大的數據價值(value)。

大數據首先要考慮的應該是“大”——海量的數據規模。谷歌執行董事長艾瑞克.施密特曾說,現在全球每兩天所創造的數據量等同于從人類文明至2003年間產生的數據量的總和。而具體到企業應用領域,漫無邊際、浩如煙海的數據對企業并無意義,日立數據系統公司(HDS)副總裁兼CTO Hubert Yoshida表示,數據量的“大”是相對而言的概念,對于像SAP的HANA那樣的“內存數據庫”來說,能把2 TB的數據用好就是勝利;而對于像谷歌這樣的搜索引擎,EB(1024×1024 TB)的數據量才能稱得上是大數據。

然而,海量數據的危機并不單純是數據量的爆炸性增長,它還牽涉到數據類型的改變。原來的數據都可以用二維表結構存儲在數據庫中,如常用的Excel軟件所處理的數據,稱之為結構化數據。但是現在更多互聯網多媒體應用的出現,使諸如圖片、聲音和視頻等非結構化數據占到了很大比重。有統計顯示,全世界結構化數據年增長率大概是32%,而非結構化數據則是63%。2012年,非結構化數據占有比例已經達到互聯網整個數據量的75%以上。而產生智慧的大數據,往往是這些非結構化數據。

“互聯網產生的非結構化數據占比越來越大,約為大數據總容量的85%,傳統行業的數據大概只有15%。”對于百度這樣的互聯網公司,建立數據體系、研發消費者畫像、品牌探針等基于大數據的應用簡直是天經地義。百度副總裁王湛將百度的大數據策略描述為“數據+工具+應用”,包括百度指數、司南、統計、搜索風云榜和研究中心在內的五大平臺數據已經形成了一個數據集合體,全程記錄消費者從需求、搜索、購買,到使用和分享的整個歷程,對客戶進行精準營銷。“通過5億消費者的千億級行為數據,百度構建了搜索營銷、無線推廣、聯盟受眾引擎、社交化營銷、品牌洞察等多維度體系的百度商業產品藍圖。”

大數據帶來的挑戰還在于它的實時處理。在數據倉庫誕生的第一天,一直就有一個話題——要把大查詢分解成小任務,這些小任務由一臺臺的機器來完成。“我們的要求在于,上億條數據的分析能夠在5秒鐘內完成。”中國民族證券信息技術部總經理顏陽表示。因為過往關聯性數據庫產品處理大量數據時的運算速度都不快,Hadoop等加速數據查詢的分布式開源數據庫從邊緣走向主流;另外,數據存儲的廠商也不再拘泥于用傳統硬盤來存儲數據,而嘗試使用快速閃存。

在商業社會中,“從數據中得到價值”一直都不是什么新鮮的東西,但是當大數據時代到來,經濟的新增量逐漸顯露出來。盡管數據挖掘從“啤酒與尿布”開始做了幾十年,但是“大數據”與我們通常所說的“數據”還是有顯著的不同。

花旗集團今年聘請了一位名叫沃森的天才顧問,幫助其增強數字銀行業務。這位沃森還同時為包括WellPoint在內的醫療服務公司提供咨詢,去年,他還在工作之余獲得了電視智力競賽節目《危險邊緣》的頭獎。據沃森的朋友講,他還有其他不愿透露的企業職務,年收入很快就會超過10億美元。這一天文數字的收入使他成為美國打工者中的超級精英……只不過,沃森是一臺機器。

對數據進行挖掘分析正在顛覆每一種類型的企業。位于紐約長島的文藝復興科技公司(Renaissance Technologies)所管理的對沖基金,目前管理著150億美元的資產。這家公司或許是20年來業績最佳的對沖基金,而領導這家公司的是兩名來自IBM人工智能實驗室的科學家,他們開發了許多數學模型用來進行分析和交易,這些模型都是建立在海量數據基礎上的,具有可靠性并可進行實際預測,而最后的結果往往與他們預想的一樣。

瞧,當我們在談論大數據的時候,我們最終談論的還是——錢。

8米長虛擬鱷魚的大數據

今年夏天上映的《百萬巨鱷》是國內首部特效驚悚怪獸類型電影,片中的真正主角并不是嬌弱的大S,而是一條長八米重達兩噸的巨型鱷魚,名叫“阿毛”。

“阿毛”是完全由特效制作產生,特效制作動物的關鍵就在于質感——皮膚的柔軟度、牙齒、眼神等細小部位的刻畫,稍有不慎就很容易露怯。為此,制作方北京歌亮傳媒有限公司召集了國內最頂級的特效技術人員,花了3個月的時間為鱷魚形象做準備。特效制作過程分為多個工種,如建模、燈光、材質、渲染、動畫、骨骼、肌肉動力學、特效、毛發等。其中,水和毛發的制作被認為是最難制作的特效種類的代表,但這也是電影《百萬巨鱷》中運用最多的部分。

傳統電影經過前期策劃、拍攝以及后期調色、配音并加入音樂等幾個步驟后就可以上映了。但是拍攝一部需要特效制作的影片,前期拍攝與后期制作所需的時間通常是1:6,后期的特效制作成了一個十分關鍵的環節。《百萬巨鱷》的拍攝和制作周期超過3年,其中大量的時間都花在了特效制作上,如何盡量縮短電影的制作周期,節省時間,以便更快獲得收益至關重要,而如此復雜的制作特效工作,需要多臺特效終端能夠及時、快速地處理大量影像數據,在有限的工期內高效地完成全片的特效制作工作,要求歌亮傳媒的存儲系統擁有更好的I/O處理能力和更高的數據吞吐量、更快的圖片渲染和下載速度,大幅減少數據量大造成的系統處理瓶頸,從而實現更適合海量影像文件處理的數據管理、虛擬化和數據保護。

最后,歌亮傳媒選擇的是參與了《阿凡達》、《功夫熊貓》、《哈利波特》系列以及《暮光之城》等后期制作的日立數據系統公司的大數據存儲平臺。僅2011年,使用該平臺的影視作品全年為全球影視產業貢獻了近40億美元的票房收入。

在影片的后期處理過程中,特效制作需要快速調用容量很大的圖片和影像素材等文件,因此特效師往往需要等待系統處理來搜索到想要的圖片,這段時間就成為對特效師工作無效的“純等待”時間。通過解決多用戶并發訪問文件系統較慢的問題,歌亮的整個系統的數據讀取速度得到了明顯提升——可以同時為多人提供優越的讀寫服務,散文件讀寫也更加流暢,特效師和相關工作人員直接獲得影像文件的速度提高30%~40%,大大提高了特效師們的創作效率,也不會讓一些即興的創作靈感因為數據調用的等待而消失殆盡。同時,通過多系統平臺的統一管理和權限設置,使得操作人員的誤操作減少,從另一個方向上提高了工作效率;得益于存儲系統的高可靠性,在讀取大量素材數據文件時,能夠保障特效渲染工作長期不間斷穩定運行,把浪費的時間降到最低。

多方合力,為整個《百萬巨鱷》特效制作工作的快速高質完成提供了重要保障。所有的工作人員都能夠將時間和金錢花在“刀刃”上,讓最終所產出作品的質量得到了實質性的提升,電影震撼力也大大加強。

“電子眼”的后端智慧

大數據對于視頻監控行業不是個新鮮話題。

海康威視副總裁兼CTO蔣海青介紹,大數據技術已經在一些地方政府主導的“智慧城市”項目中有了實施,“平安城市”視頻監控應用是項目的重要組成部分。

作為全球視頻監控產品的領軍企業,海康威視在國內參與的“平安城市”應用是視頻監控領域規模最大、業務最復雜的系統,其視頻接入規模從成千上萬到十幾萬、甚至幾十萬都有,其中涉及了治安監控、指揮通信、偵查破案、規范執法、社會服務等多個分區領域,“而且現在視頻監控所采集的視頻質量也從標清進步到了高清的時代,因此大家可以想象一個大型‘平安城市項目所產生的數據信息量有多大?而視頻監控所產生的數據無論在規模還是結構上,都符合大數據的定義。”蔣海青表示。

“平安城市”視頻監控采集到的海量數據也和其他種類的大數據一樣,只有進行智能、高效處理才更具價值。蔣海青指出:“傳統的視頻監控通常都需要人工監控,可人一般對視頻只有20分鐘的有效監控,之后注意力和關注點就下降了。”相比之下,智能化的監控技術不但不會像人一樣產生疲勞,能夠不間斷地運行,而且它“還能從大量非結構化的視頻數據中提取出有價值的信息,將視頻監控的應用范圍從過去和目前以事后查看為主,慢慢轉變為事前預警,這就可以為公安、交通等各行各業提供更為有效的業務信息支持。”

上述兩個特點決定了“平安城市”視頻監控應用需要大數據技術的支撐。“我們也曾經想過用原有的關系型數據庫來承載相關的數據和應用,但是關系型數據庫已經沒有辦法支持海量的、非結構化或半結構化的數據。”蔣海青稱,海康威視最終選擇的是英特爾的Hadoop大數據平臺。

海康威視認為應用端需要的采集點很多、視頻通道非常大,因此“處理平臺不能是全集中式也不可能是全分布式,而應該是兩者的結合”,而Hadoop的靈活性對此非常適用;海康威視要在Hadoop的數據管理和組織層上加入用于視頻數據的圖像處理、分析、分類技術,基于語義的分布式視頻搜索技術來對它們進行挖掘,英特爾的開放平臺也提供了充足的創新空間。這一方案目前已經在海康威視參與部署的某些城市的智能交通監控領域得到了應用,它可以掌控城市交通攝像頭覆蓋區域中任一車輛的行駛狀態、運行軌跡,分析出其是否違章行為或有潛在犯罪可能性,而且還能對海量交通信息進行比對、分析和預測,實現車輛布控、擁堵狀態服務、出行最優路徑規劃、交通管理服務等功能。

未來,海康威視還計劃將這一方案應用于小微企業或個人用戶,例如將一些小店鋪、連鎖超市的視頻監控通過云服務的方式整合起來,通過分析其視頻監控數據提供潛在風險的預警。“這樣的系統是完全基于互聯網的平臺,所以它的數據量可能比‘平安城市的規模還要大,數據的采集、分析、存儲及檢索的難度還要高。”蔣海青稱。

3G上網“明白賬”

用微信聯系上一群好友,然后在手機上找到一家附近的特色餐廳,大家紛紛開著導航過去,上菜前低頭看微博,菜上了不吃先拍照分享,這就是一部分當代都市人的真實生活寫照。

在智能手機走進千家萬戶,3G網絡普及,流量飛速增長的今天,對于流量、上網記錄的投訴也同時以不可控制的速度遞增,甚至運營商也曾被消費者以“欺詐”等名義起訴,類似于“您的智能手機可能進行了系統或軟件的更新”等含糊的解答再也應對不了消費者的質疑。為客戶提供上網記錄查詢并非我們想象的這么簡單。

這個查詢系統需要提供海量級的數據應用。今年上半年,我國移動互聯網用戶已達3.88億,同期國內某電信運營商月移動上網記錄也增至上萬億條之多,而且每半年時間其上網記錄數量都會成倍遞增。特別是移動上網記錄擁有高容量、數據類型多樣化、持續不斷增長刷新以及能夠從中挖掘出有價值的信息這四個基本特征,算是典型的“大數據”,傳統的關系數據庫根本無法應對上網記錄的存儲、管理和處理重任。

有運營商已進行過測試:當傳統關系型數據庫承載百億條數據的時候,就已開始有心無力,一個查詢請求有可能幾個小時都不能返回結果。所以,針對大數據的一系列管理和處理技術也就成為了運營商構建高效透明查詢系統,樹立誠信服務的關鍵技術。

國內某3G服務的運營商近期就采用一套基于英特爾架構的解決方案率先化解了這個難題。這套解決方案的核心硬件和軟件平臺分別是基于英特爾至強處理器的服務器,以及英特爾Hadoop發行版,后者可以為大數據提供分布式、橫向可擴展的數據組織與管理功能,并將應用負載分散到硬件系統的每個節點上。

最終,該運營商成功構建了移動用戶上網記錄查詢與分析支持系統。該系統使得相關記錄檢索速度達到了秒級,即輸入任何一個城市的號碼,其詳細上網記錄會在1~2秒種的時候內被檢索出來;在用戶界面中輸入號碼后,瞬間就可以得到每天的流量記錄,詳細的網站地址,在什么位置上的網,用的是什么網絡以及起始時間等等,用戶再有任何質疑,運營商的客服人員都可以通過清晰明確地答復,消除他的疑慮。

“因為有了大數據,有了現在的這些技術支持,以前需要3-6個月才能查詢的記錄我們現在只需要幾分鐘,甚至更快。”運營商負責人表示,“這些數據的挖掘分析還將為最終客戶的使用體驗展現出更高的價值。”

主站蜘蛛池模板: 试看120秒男女啪啪免费| 在线观看无码av免费不卡网站| 成人国产三级在线播放| 日韩欧美中文在线| 国产91精品调教在线播放| 有专无码视频| 国语少妇高潮| 国产日韩久久久久无码精品| 久久久久国产一级毛片高清板| 国产免费自拍视频| 精品视频福利| 亚洲男人的天堂在线| 欧美精品三级在线| 国产人成在线视频| 欧美全免费aaaaaa特黄在线| 国产一级做美女做受视频| 亚洲欧美一区在线| 国产呦视频免费视频在线观看| 欧美亚洲另类在线观看| 亚洲一区二区日韩欧美gif| 免费不卡在线观看av| 亚洲天堂精品视频| 欧美综合成人| 成人午夜免费观看| 日韩欧美中文| 国产三级精品三级在线观看| 欧美日韩精品在线播放| 亚洲欧美人成电影在线观看| 都市激情亚洲综合久久| 亚洲精品你懂的| 国产精品蜜芽在线观看| 亚洲国产精品日韩欧美一区| 国内精品免费| 国产哺乳奶水91在线播放| 亚洲人视频在线观看| 制服丝袜国产精品| 亚洲妓女综合网995久久| 中文字幕在线一区二区在线| 国产性生交xxxxx免费| 狠狠色丁香婷婷| 久久精品一品道久久精品| 一本久道久久综合多人| 福利片91| 久久香蕉国产线看精品| 老司国产精品视频91| 亚洲久悠悠色悠在线播放| 国产精品无码AV中文| 国产亚洲一区二区三区在线| 丁香五月激情图片| 亚洲天天更新| 国产中文在线亚洲精品官网| 国产亚洲欧美另类一区二区| 国产精品尤物铁牛tv| 久久午夜夜伦鲁鲁片不卡| 免费看美女自慰的网站| 欧美成人aⅴ| 黄色网站不卡无码| 国产精品99在线观看| 刘亦菲一区二区在线观看| 高清色本在线www| 午夜少妇精品视频小电影| 国产9191精品免费观看| 91无码网站| 性激烈欧美三级在线播放| 日韩无码黄色网站| 国产在线自揄拍揄视频网站| 亚洲精品中文字幕午夜| 亚洲成人免费看| 亚洲国产欧美国产综合久久| 青青草原国产| 日本一区高清| 日韩福利视频导航| 日韩国产综合精选| 99视频精品全国免费品| 日韩国产综合精选| 99视频在线免费观看| 国产高潮流白浆视频| 综合天天色| 久草青青在线视频| 亚洲欧美日韩另类在线一| 亚洲成人高清无码| 国产h视频免费观看|