邢帆
進入大數據時代,數據信息的作用遠不止步于銀行與電信業的業務發展中,政府行業對于數據的使用與價值的開發正逐漸實現著數據的更深層次價值。從人口普查到總統選舉,數據的大作為正以迅猛的速度滲透到各個行業。
數據的正能量
大數據被用來描述信息爆炸所產生的海量數據。Jim Gray的新摩爾定理認為,每18個月全球新增的信息量是計算機有史以來全部信息量的總和。截至2010年,人類擁有的信息總量大約是1.2ZB(1ZB等于1萬億GB)。IDC預計,到2020年,世界上的數據存儲總量將達35ZB。數據之所以增長如此之快,源于各類傳感器、智能終端的劇增。而高清晰圖像和視頻,更使得數據呈指數級增長。如何收集、管理和分析數據日益成為信息通信技術創新的重中之重。
對此,工信部信息化推進司副司長董寶青曾表示,要積極看待大數據熱潮。大數據的興起,不完全源于信息技術變革到了一個多么了不起的高度,而源于一國政府、企業、國民的信息化應用和創新思維到了一個嶄新的高度。大數據的本質是對信息資源、知識資源、智慧資源開發利用的高度重視與創新。而我國在中辦、國辦34號文件里已經深刻闡述過這一理念,現在需要更加積極地去推動。
有資料顯示,在發達國家,制造業、銀行業、消費營銷行業等較早進入大數據時代,各類顧客點擊、瀏覽、反饋和交易記錄,都構成了大數據的基礎。百度目前數據總量接近1000PB,存儲的網頁數量接近10000億,每天還會對這些數據進行更新,響應用戶的請求也是幾十億次。通用電氣正投資15億美元建設全球軟件和分析中心,擬雇傭400名數據科學家,協調全球1萬名軟件工程師通過共同的平臺工作。IBM商業價值研究院和牛津大學商學院對全球數千名企業高管的調查顯示,有63%的企業管理者希望大數據技術能與企業運營管理實踐相結合,形成企業新的核心優勢,28%的受訪者所在企業已經開始試點部署大數據。
正如我們所看到的,數據的力量已經不再止步于金融和電信這些傳統的“數據大戶”,政府行業正逐漸向著服務的標準靠近,數據對政府部門的作用正在逐漸擴大。
2008年,奧巴馬利用網絡力量當選美國總統,被譽為首位“網絡總統”。而就在不久前,奧巴馬再次借助超強的“大數據”能力成功連任,其背后幾十人的數據分析與挖掘團隊也浮出水面。它幫助奧巴馬在獲取有效選民、投放廣告、募集資金方面起到了不可忽視的作用。
中國聯通研究院副院長童曉渝認為,無論從獲取、存儲、處理和服務哪個環節看,大數據產業都正在快速形成。要推動其發展,應從戰略的高度去做好頂層設計和行業的發展規劃,標準規范,示范工程,還要前瞻性地完善制度建設,用法律法規來保證大數據的公共性、真實性、安全性和隱私保護等。
從挑戰到機遇
為了從數據中獲得有價值的信息,做出更快更好的決策,企業對信息解決方案、服務和資源的投資所產生的價值成為信息回報。由結構化數據、非結構化數據、以及半結構化數據組成的大數據,是企業當前面臨的挑戰。同時非結構化數據在未來的增速將是結構化數據的3倍。社交媒體、移動互聯網將構成大數據重要的部分。
面對數據,想讓其從挑戰變成機遇,首先在不同的行業里要了解如何在產生大數據的時候去分析用戶的商業價值,我們要了解它管理信息的戰略。當然也要了解整體數據,到底是從什么系統來,做什么用,最后和哪些客戶有關系,目前處理的,大部分還是跟內部的系統有關系。另一方面,這些數據即使幾個PB、幾十個PB也都是小部分,這些數據的質量到底如何?如何讓幾天獲得的信息在幾秒鐘之內達到更高的質量?數據從哪里來?意味著什么?以及通過績效管理和在不同的行業里去分析數據產生的同時,做財務相關的分析、人力相關的分析,供應量相關的分析,比如核心銀行的客戶系統的分析,電信網絡的分析,BSS系統的分析等。
其次,企業需要面對的最大的挑戰就是數據的競爭。數據已經成為了現在生產過程中的基本要素和資產。數據如何競爭?投資回報率如何建立?數據投資回報是數據價值除以數據成本,第一,需要降低數據成本,提升數據價值。而降低數據成本有很多做法,其中最重要的就是把低活躍度的數據轉移到低成本的存貯器上去。怎樣增加數據的價值呢?要收集更多、更全面的數據,比如說社交化ERP。第二,要針對數據質量有一個數據治理的隊伍和流程。第三,要有很好的數據分析的能力,“數據可視化”是當前的大趨勢,通過圖形、圖像、動畫等等一同展示數據,讓數據淺層的關系得到更好的理解和發現。
農夫山泉首席信息官胡健說:“運用內存數據庫平臺進行實時海量數據處理,運費報表從原來的24小時縮短到只需3.6秒即可生成,速度提升了兩萬多倍,促進業務優化,擺脫了傳統的IT維護和數據滯后的問題,整個生產環境呈現出更順暢的運營、更準確的數據和更高效的性能,大幅提升我們應對市場變化的能力。消費品行業競爭激烈,但只要我們比人家快一步,我們就可以占得先機,就可以占領市場。”日本三井情報株式會社,生物信息和基因組分析方面的專家建立了一個實時的分析數據庫平臺,通過采用復雜的、迭代算法,并使用Hadoop進行基因組序列預處理,成功地把基因組分析的時間從以數天縮短到幾分鐘。
諸如此類,大數據對于企業能夠創造出多大的價值是不能夠給出定論的。數據的價值也并不在于挖掘與分析,而是從收集和存儲就已開始。運營商想要從中獲益就必須高度重視大數據時代的網絡建設,還要對寬帶網絡進行智慧管理。金融行業則需盡快完善其在安全領域受到的注目,利用能多信息實現信息增值。而在政治領域,服務型社會中,數據將“大”有作為。