
你知道嗎?在古代,那些占卜先生可能是世界上最早的大數據實踐者,測字算命、觀測星象可謂是數據應用的典范。在電影《不二神探》里,由香港明星方力申飾演的算命先生頗具無厘頭氣質,但他的一句臺詞卻直接道破了大數據的天機:“算命,其實就是數據的搜集和分析的學問”。
今天,只有數據本身是科學的,分析、選擇、清洗數據的過程則更接近藝術,而評價各路占卜先生水平高低則是看他們對數據的解讀和演繹。
看來,大數據一直在改變歷史進程。浪潮集團執行總裁、首席技術官王柏華認為,其實,我們每天都在和數據打交道,數據在不經意間已然改變了我們生活的方方面面。
數據來源多種多樣
當前,數據已經成為真正有價值的資產。大數據時代,數據來源多種多樣,王柏華認為,主要分為交易數據、交互數據、傳感數據。即為ERP、電子商務、POS機等交易工具帶來的交易數據,微信、微博、即時通信等社交媒體帶來的交互數據,以及GPS、RFID、視頻監控等物聯網設備帶來的傳感數據。他用了一個很恰當的比喻,這些雜亂的數據就像來自五湖四海的人們所說的各種方言,亟需提供大數據梳理服務,讓未來的數據都講普通話。另外,他認為,從數據價值歸屬來看,大數據可歸納為組織數據和互聯網數據,只有將組織數據和互聯網數據兩者整合才能創造更大價值。將這些數據概括為組織數據和互聯網數據兩大類型,但在實際應用中,組織數據與互聯網數據尚未有效整合,在數據處理中,雜亂的數據、海量的數據,沉睡的數據嚴重地影響了數據的有效利用。如何整合這些數據資產,使其為政府治理、企業決策乃至個人生活服務,是大數據的核心價值。
面對這些挑戰,人們急需綜合的大數據平臺對各種數據進行有效處理。據王柏華介紹,為了進一步整合組織數據與互聯網數據,浪潮推出專門針對互聯網開放數據的浪潮Dro Data(卓數)數據服務平臺。Dro Data互聯網數據服務,可通過采集互聯網公開網頁,建立原始網頁鏡像,并對網頁內容進行分詞、分類、存儲等處理,建立了豐富的數據資源目錄和海量的可用數據,并將互聯網數據分為19個大類,進行分類整理。目前,浪潮已在哈爾濱、濟南、長治、綿陽、云南等地建立了基于云計算的互聯網數據采集中心,截止到9月底,已采集超過7.5PB的互聯網數據,并可對外提供各類數據服務。
大數據平臺 更好地服務客戶
隨著我國企業信息化程度和水平不斷提高,越來越多的企業需要大數據分析的能力以提高競爭力。在互聯網,電子商務,金融,電信,零售,物流等數據驅動型行業,客戶分群,客戶行為分析,客戶關系管理,市場營銷,廣告投放,業務優化,風險管理等企業核心業務越來越依賴于對數據的有效分析與挖掘,為此,大數據處理平臺功不可沒。
在“Inspur World 2014”上,浪潮發布了以云中心、云服務、云安全、云伙伴為四大方向的浪潮集團云海戰略,并指出信息化建設正在從以應用為中心向以數據為中心轉變。當前,數據不僅滲透到每一個行業和業務職能領域,還滲透到每一個個體的社會生活之中,形成了現實世界與虛擬世界共存的局面。在大數據時代下,浪潮集團全新發布了將組織數據與互聯網數據整合的大數據戰略,并將通過大數據平臺、大數據服務和大數據應用三大方向共同推進浪潮大數據戰略的落地。“傳統數據的整合是正在進行的必由之路,而大數據的到來使這種搖搖晃晃的步伐變得堅定起來。”王柏華表示,“從數據價值歸屬來看,大數據可以進一步歸納為組織數據和互聯網數據,只有將組織數據和互聯網數據兩者整合才能創造更大價值。”
據王柏華介紹,針對組織數據和互聯網數據兩大類型,浪潮還推出了云海IOP平臺和云海卓數平臺。云海IOP是開放式大數據處理平臺,能夠對組織內部數據進行整合、分析,并提供創新應用開發平臺;云海卓數平臺采集海量互聯網數據,并淬煉其中有價值的信息。基于這兩大平臺,浪潮提供三類大數據服務,即組織內部數據服務整合、互聯網數據及組織數據融合、組織數據的對外開放,合作伙伴可以基于這些服務開發創新應用,共同構成了浪潮大數據產業鏈,打造大數據產業生態圈。
現在,浪潮的大數據平臺和服務已經通過服務客戶應用于各種領域,在組織數據和互聯網數據的整合中,為社會提供更多價值。比如,對大數據的處理,也是公安云性能提升的重點。以山東警務云為例,浪潮在幫助濟南公安局在搭建云數據中心的基礎上構建了大數據平臺,以開展行為軌跡分析、社會關系分析、生物特征識別、音視頻識別、銀行電信詐騙行為分析、輿情分析等多種大數據研判手段的應用,為指揮決策、各警種情報分析、研判提供支持,做到圍繞治安焦點能夠快速精確定位、及時全面掌握信息、科學指揮調度警力和社會安保力量迅速解決問題。
警務云通過整合公安內外部信息資源,全面提升數據共享和信息聯動運轉效率,通過跨區域、跨部門、全警種聯動、多信息軌跡即時跟蹤和信息共享,為公安機關在警務民生、多偵聯動、情報分析、社會治理等方面提供了強有力的信息化支撐平臺。“警務云”平臺通過內置實戰要素和技戰法的警務千度,集成1.5億人像庫,以及旅店業、網吧、鐵路、民航、交通卡扣等數據,使單項信息拓展至28類321項,是傳統搜索引擎信息量的10倍,搜索效率提升了100倍,在目前授權9700名民警使用的情況下,日均查詢量高達12萬次,帶動后臺4億次搜索、百億次運算。
大數據的應用打破了公安工作傳統的發展路徑,為濟南市公安局警務運作、公安執法、隊伍管理等方面開辟了新的發展路徑。通過云平臺對數據進行控制,利用對大數據的監控進行挖掘,實現人像、指紋比對、卡口監控等數據融合處理,為領導指揮決策、社會輿情分析提供信息研判的依據,進一步提升了警務工作能力。
開放與隱私的權衡
王柏華認為,大數據要想釋放出大價值,必須共融共通,走開放之路,讓不同領域的數據真正流動起來、融合起來。當然,這個開放市場不僅僅是政府、企業之間開放,企業對個人也要開放。
據王柏華介紹,現在大量的關于國民經濟或者說民生的數據其實還在封閉狀態,在工商部門、銀行、保險、公安、醫院、社保,包括電信運營商機構的手里。如何讓這些數據流動起來,能讓大家更方便,其實應該由政府帶頭實現等級制數據的開放共享。在不違反保密或者是國防的情況下,如果不開放大數據,那么大數據研究和創業都是無米之炊。
縱觀國內目前情況,王柏華表示,政府數據開放進程還顯得不夠快,這其中與基礎薄弱有關。談到基礎,他認為,政府無論是開放數據還是應用大數據,其基礎是數據整合,而目前政府的數據整合還停留在初級階段,尤其是政府跨部門之間的數據整合顯得動力不足。
如今,互聯網以及社交媒體的發展讓人們在網絡上留下的數據越來越多,海量數據再通過多維度的信息重組使得企業都在謀求各平臺間的內容、用戶、廣告投放的全面打通,以期通過用戶關系鏈的融合,網絡媒體的社會化重構,為廣告用戶帶來更好的精準社會化營銷效果。社交媒體對于大數據的解構不可避免地帶來隱私問題,當用戶在使用電子郵件、社交網絡的時候,大概也會知道自己的信息將被記錄下來,當用戶發表的言論或者分享的照片、視頻等,都決定著互聯網運營商將向你推薦什么樣的資源和廣告;當用戶拿著智能手機滿世界跑的時候,手機廠商們早已通過定位系統把你的全部信息收羅在自己的數據庫里,利用這些信息來構建地圖和交通信息等。
以前,這些記錄幾乎不會對普通人造成影響,因為它的數量如此巨大,除非刻意尋找,人們不會注意其中的某些信息。但是,隨著大數據技術的不斷進步,這一狀況正在悄然發生改變。大數據技術就好比互聯網應用中的“夏洛克·福爾摩斯”,隱私問題又該如何權衡?王柏華認為,開放公共數據,并善用這些數據的話并不會侵犯公民個人隱私,數據只有真正開放了,才能為人類創造更大的價值。
大數據人才 求賢若渴
“世界的本質是數據”,《大數據時代》作者維克托·邁爾此話擲地有聲。然而置身于大數據的浩瀚海洋中,我們不得不承認這樣一個事實,人類的技術水平目前還沒有達到隨心所欲地處理一切數據的地步。
王柏華認為,除了以上談到的數據來源真實可靠,處理平臺精益求精,各行業間數據開放以外,大數據人才更是求賢若渴。關于大數據人才的培養,不管是政府,還是企業,亦或高校,依舊挑戰重重,并不是一蹴而就,而是一個漫長的過程,必須義不容辭的往這個方向挺進。此外,他還呼吁我國應盡快成立大數據局,而其中的大數據局長,即中國的CDO這個角色,也是至關重要的。