

掘大數據之寶藏
提及大數據,大多會圍繞幾個角度:一方面是它的海量性;另一方面是快速數據處理能力;另外就是數據的多樣化。通過一些結構化的數據,企業ERP、商務平臺、非結構化視頻圖片、收集到的各種數據、互聯網交互數據,各種各樣的數據種類給大數據技術提供了一個很好的發展平臺,因為大數據的強項就是處理更多的數據種類,并快速把數據進行分類存儲、挖掘以及提取它的價值。
大數據因其巨大的商業價值和市場需求正日益成為推動信息產業變革的新引擎。面向大數據市場的新產品、新技術、新服務、新業態正在不斷涌現。大數據時代的到來已經不是一種單純的理念思路,而是一種不可逆轉的趨勢了。
首先,大數據能夠產生價值。無論是在日常生活中還是企業生產里,都需要通過數據的收集和處理來做出決定,以最大化的滿足個人或者客戶的需求,而大數據理論的特點就在于這一過程的高效性、簡易性甚至實時性。通過大數據的處理,可以完成對于系統或是結構化數據的實時更新,從而完成最快速度的決策,這毫無疑問將為社會進步創造巨大的價值。
其次,大數據具備不可替代性。隨著信息社會的發展,信息量將以爆炸的速度進行膨脹增長,在這個過程中無論科技具有怎樣的發展方向,對于大規模數據的處理將始終占據工作和科研中重中之重的位置,而無論是云計算還是其他的執行方式,都只是對于這一思想的具體實現和有力支撐,而不可能從根源上替代大數據這一體系的存在價值。
最后,大數據具備充足的生命力。無論是社交網絡的廣泛推廣,還是諸如蘋果、谷歌等企業對于大數據發展的不斷推動,大數據的整體發展形勢都會像滾雪球一樣越來越大。而同樣的,調查表明,有超過80%的公司代表認為大數據理論的發展將對公司的商業分析等過程起到有效的幫助,這一點有力地證明了大數據具備充分廣闊的生長空間。
大數據不僅影響著人們生活的方方面面,更重要的是它給企業帶來的改變。據Gartner預測,企業數據將在五年內增加800%,其中80%是非結構化數據,大部分來自團體、社區,以及社交網絡的非業務數據。面對如此規模的數據,對于有準備的企業來說這無疑是一座信息金礦,能否將海量數據轉換為有價值的信息,將成為未來企業的決勝法寶。
開源 大數據的制勝法寶
大數據蘊藏的商業價值不可小覷。對于當今的企業而言,數據就是一種重要的戰略資產,如果能夠正確評估其商業價值并且迅速行動起來,將會在未來的競爭中占得先機。然而,傳統關系型數據庫的技術擅長處理結構化數據,對于未來企業中占絕大多數的非結構化數據卻無從下手。此時,大量新技術應運而生。
大數據獲得動力,關鍵在于開放源代碼,幫助分解和分析數據。以Hadoop為代表的一系列開源技術,成為大數據存儲、處理和分析的主力軍。各大IT巨頭瞄準開源技術,紛紛推出各自的大數據戰略。Hadoop作為其中的最受關注的技術,已逐漸走向商業化的道路。不可否認,Hadoop的確是一款非常出色的處理大數據的開源工具。除了Hadoop之外,還有很多優秀的技術和工具如雨后春筍般成長起來,包括開源語言R、NoSQL數據庫和非結構化數據存儲解決方案等,也已成為大數據舞臺上不可或缺的成員。
開源是靈感的匯集,凝聚了全世界范圍自由開發人的思想結晶;開源,是無界的合作,沒有地理位置的阻隔,沒有商業條款的羈絆。縱使開源不是為商業化而生,但事實證明開源卻有著商業化應用不可比擬的優勢。
現在的商業智能和企業搜索的專有應用程序都沒有“坐以待斃”。商業智能增加了更多類似搜索的功能,并且搜索還取代了很多商業智能功能。但是在幾年前,專有解決方案似乎是最安全的方法,而開源解決方案似乎更具風險。而現在,很多公司開始看到,因為開源項目獨立于企業財務決策,他們對于保護其長期投資更具后勁。此外,很多企業發現他們更容易獲得、培訓和留住開源人才,因為,他們可以深入代碼。
何以解大數據存儲之惑
也許,人們對大數據的印象很多是從存儲容量的廉價性而來。但實際上,企業每天都在創造大量的數據,而且越來越多,而人們正在努力地從浩瀚的數據海洋中尋覓有價值的商業情報。另一方面,用戶還會保存那些已經分析過的數據,因為這些舊數據可以與未來收集的新數據進行差異化分析,依然有潛在的利用可能。
大數據應用的一個主要特點是實時性或者近實時性。比如,如果警察攔住一輛車,想得到這輛車的相關信息,那么這對時間的要求是越快越好。類似的,一個金融類的應用,能為業務員從數量巨大種類繁多的數據里快速挖掘出相關信息,能幫助他們領先于競爭對手做出與交易相關的決定。
隨著大數據應用的爆發性增長,它已經衍生出了自己獨特的架構,而且也直接推動了存儲、網絡以及計算技術的發展。畢竟處理大數據這種特殊的需求是一個新的挑戰。硬件的發展最終還是由軟件需求推動的,就這個角度來說,可以很明顯地看到大數據分析應用需求正在影響著數據存儲基礎設施的發展。
數據通常以每年50%的速度快速激增,尤其是非結構化數據。隨著科技的進步,有越來越多的被傳感器采集的數據、移動設備產生的數據、社交多媒體產生的數據等等,所以數據只可能繼續增長。因此大數據需要非常高性能、高吞吐率、大容量的存儲設備。
當下,云存儲的方式在歐美市場上的應用很廣泛,大數據用云的形式去交付有兩個典型:面對好萊塢的電影制作商,這些資源是黃金數據,如果不想放在自己數據中心里,把它們歸檔在云上,到時再進行調用;此外,越來越多的企業將云存儲作為資源補充,提高持有IT資源利用率。
結語:
大數據可以用在各行各業,某些行業因為大數據的引入可能帶來前所未有的發展。那么針對國內市場而言,具體哪些客戶更傾向于大數據呢?第一類客戶是電信業,電信行業擁有海量且價值連城的數據;第二類客戶是金融業,金融行業的客戶需要對大數據的非常準確把握,由于其目前面臨著前所未有的挑戰,需要提高業務的類型,提高客戶的黏度和創新,所以使得金融行業需要對業務本身進行挖掘和使用,這就涉及到了大數據;第三類客戶是零售業,包括在線的零售電商都在使用大數據對客戶的行為進行挖掘追蹤,實現交叉銷售,提升客戶體驗。此外,感興趣的行業還包括娛樂、媒體、地產行業等等。
抓住大數據所帶來的機遇也需要解決一些棘手的問題。如隱私、安全、知識產權、可靠性都是急需解決的問題。企業不僅需要投入人才和技術,還需要對流程、結構進行優化,以適應大數據的需求。