林崇責
大數據與云計算的邂逅
林崇責
近年來,新一輪信息技術革命與人類經濟社會活動的交匯融合,正在引發影響深遠的經濟社會發展的大變革。馬云提出,人類已經從IT(Information Technology)時代走向DT(Date Technology)時代。數據作為重要的戰略資源,其作用日益受到重視,“無數據,不說話”意識逐步深入人心。大數據和云計算自然而然的成為了新一代信息技術的兩大發展趨勢。2015年10月14日,浙江省長李強在云棲大會做了“數據充滿機遇,云端決定未來”的主旨演講。這里的“數據”就是指大數據,“云端”即指云計算。
當大數據遇上云計算,會帶來什么美妙的結局呢?筆者認為,大數據與云計算兩者相輔相成、相互促進。筆者嘗試從大數據和云計算的內涵特征出發,來探究信息經濟時代大數據和云計算兩者密不可分的關系。
大數據是一種生產資源,蘊藏價值巨大。當前,人類已經進入大數據時代。隨著摩爾定律的演變,計算機存儲和計算技術進步和價格下降,使得人類經濟社會活動“一切皆數據化”從理論成為了現實。正如你在沙灘上行走就會留下一串串腳印一樣,無論你在使用電話、駕駛汽車、商城購物、醫院看病等線下活動,還是你在網絡聊天、起草文件、使用郵件、搜索資料等線上活動,甚至是呼吸空氣、心臟跳動、夜間睡眠等生理活動,你的全部行為都會留下數據“足跡”,并以“0”和“1”的二進制形式存儲起來。數據已然成為和能源、材料并列的戰略資源,它作為一種必不可少的生產資料,蘊藏著巨大的財富。例如,美國匹茲堡大學將記錄在報紙、報告、微縮膠片上美國各地自1888年以來有關傳染病發生和死亡的多元、碎片、海量的數據收集、整理并實現數據化,建立了1888至2010年美國50多種傳染病電子數據檔案庫,通過數據建模和分析,用歷史數據證明了免疫苗的發明和使用,避免了一億以上的美國人死于傳染病。此外,Google公司還通過對全網絡、全樣本的流感有關的搜索查詢總數和來自于傳統流感監測系統的數據進行關聯比較,分析出世界各個地方流感的活動情況。
大數據作為待開采的金礦,對信息技術提出了更高的要求。大數據作為以容量大、類型多、存取速度快、應用價值高為主要特征的數據集合,它的價值不在于占有,而在于應用。通常來說,數據本身是沒有多少價值的,直到開發者有足夠的能力去采集、儲存、處理、應用這個數據,才產生價值,這個過程就是數據價值開發利用的過程。和傳統的數據分析最大區別在于,大數據的價值往往隱藏在傳統技術方式難以展現、錯綜復雜的關聯關系中,對高頻、海量數據處理的速度要求更高。一般說來,越有價值的數據越呈現出在線化(實時互動)、全量化(非樣本)、行為化(更多細節)、意愿化(情感判斷)和跨界化(多維關聯)等特點,傳統的IT架構的支撐已經力不從心,這對數據的IT處理能力提出更高的要求。
云計算是一種生產能力,正推動大數據以低廉成本變成財富。“行至水窮處,坐看云起時”。云計算為大數據分析處理提供了新的技術手段,它作為推動信息技術能力實現分布計算、按需供給、動態調整的全新技術形態,正契合了大數據對IT基礎設施的高要求。云計算是把一堆雜亂無章的原始數據有效轉化為知識的最佳手段,離開云計算,大數據的開發利用就會寸步難行。這也是Google、微軟、Facebook、阿里、騰訊、百度等最領先的互聯網企業都在研發自己的云計算平臺、取代傳統的IOE平臺(以IBM服務器、Oracle數據庫、EMC存儲為代表的傳統IT基礎設施平臺)的根本原因。當前,以阿里云為代表的云計算已經將計算加工成為和水、電、氣一樣的公共服務,借助“云”的力量,可以實現對多格式、多模式、高頻度的大數據的統一管理、高效流通和實時分析,挖掘大數據的價值,發揮大數據的真正意義。
大數據和云計算相輔相成,助推數據強國建設。大數據與云計算在經濟社會應用中產生的價值是有目共睹的。大數據和云計算比翼雙飛的時代已經到來,它們的緊密結合,有利于加快建設數據強國,提升政府治理能力,推動經濟轉型升級。大數據是云計算的服務對象,也是實現最終價值的渠道;云計算是大數據開發利用的最佳手段。離開了大數據,云計算就成了“無源之水”;離開了云計算,大數據也就成為了“紙上談兵”。筆者認為,“DT”時代,既要做好大數據的業務分析,也要注重云計算等支撐技術的研發應用,使得在挖掘“數據金礦”過程中實現事半功倍的效果。